Logo Eventkampus
Perpustakaan judul masih dalam tahap pengembangan, admin siap menampung kritik dan saran
Features Selection untuk Klasifikasi Website Phishing Menggunakan Naive Bayes
Muhammad Ganjar Imanudin (2019) | Skripsi | Teknik Informatika , Teknik Komputer
Bagikan
Ringkasan
Kebutuhan akan internet yang saat ini telah menjadi kebutuhan primer menimbulkan pengaruh positif dan negatif. Pengaruh negatif yang muncul yaitu terjadinya kejahatan melalui internet yang disebut cybercrime. Kejahatan tersebut banyak dilakukan dengan melakukan phishing yaitu seni dalam meniru sebuah situs resmi untuk menipu korban guna mendapatkan informasi pribadi. Diperlukan pendeteksian untuk menentukan apakah suatu situs termasuk ke dalam phishing atau tidak. Pendeteksian situs phishing dapat dilakukan dengan pendekatan machine learning menggunakan algoritma naïve bayes classifier. Namun, algoritma tersebut memiliki kekurangan mengasumsi fitur-fitur secara independen. Penelitian sebelumnya memberikan solusi untuk meningkatkan performa klasifikasi algoritma tersebut dengan melakukan proses pemilihan fitur. Penelitian ini mencoba menggunakan metode-metode filter, wrapper, dan embedded yang kemudian hasil fitur terpilih digunakan sebagai fitur untuk melakukan klasifikasi dengan naive bayes classifier. Keseluruhan fitur yang digunakan berasal dari penelitian sebelumnya. Pengaruh performa model dengan proses pemilihan fitur dan tanpa pemilihan fitur akan amati. Eksperimen menunjukan bahwa metode wrapper menaikkan performa model tanpa pemilihan fitur. Metode wrapper menaikkan performa model dengan nilai rata-rata akurasi sebesar 1%, sementara metode filter dan embedded tidak mempengaruhi. Kata Kunci: internet, phishing, fitur, pemilihan fitur, naive bayes classifier.
Ringkasan Alternatif
Needs of internet which have now become primary have positive and negative impact. The negative impact such as occurrence of crime through the internet called cybercrime. The crime is often done by doing phishing, the art of imitating an official website to deceive victims to obtain personal information. The detection needed to determine whether a site is a phishing or not. The detection of phishing sites can be done with a machine learning approach using the naive bayes classifier algorithm. However, the algorithm has the disadvantage of assuming features independently. Previous research provides a solution to improve the performance of the classification algorithm by performing the features selection process. This research tries to apply filter, wrapper, and embedded methods, then the selected features is used as a features to classify using naive bayes classifier. The overall features used are from previous studies. The effect of model performance with the features selection process and without features selection will be observed. Experiments show that the wrapper method increases the model performance without selecting features. The wrapper method increases model's performance with an average accuracy of 1%, while filter and embedded methods have no effect. Keywords: internet, phishing, features, features selection, naive bayes classifier.
Sumber