Perpustakaan judul masih dalam tahap pengembangan, admin siap menampung kritik dan saran
Analisis Klasifikasi Email SPAM Menggunakan Teori Kombinasi Dan Metode Smoothing Dirichlet Naive Bayes
Ilham Abdul Rahman F NIM. (2017) | Skripsi | Teknik Informatika
Bagikan
Ringkasan
Email spam merupakan penyalahgunaan sistem pesan elektronik untuk mengirim pesan massal yang dapat menghabiskan waktu untuk menghapus pesan tersebut dan menghabiskan kapasitas penyimpanan. Oleh karena itu dibutuhkan spam filter untuk menangani email spam. Metode yang banyak digunakan yaitu Metode Smoothing Dirichlet Naïve Bayes. Teori Kombinasi digunakan dalam penelitian ini karena diasumsikan dapat mengenali pola kata subject email spam. Perhitungan nilai Smoothing Dirichlet Naïve Bayes akan dilakukan terhadap setiap kombinasi kata terbentuk. Dalam melakukan proses analisis, data email yang digunakan yaitu data email dari web Spamassassin dengan kode prefix Ãâ20030228Ãâ. Parameter yang digunakan dalam analisis klasifikasi ini adalah subject email. Praproses yang dilakukan adalah pembacaan file email, tokenisasi, penghapusan stopword. Tahap praproses dilakukan untuk mempersiapkan data yang akan digunakan pada proses utama. Penambahan data latih pada sistem melakukan tahapan praproses dan proses kombinasi. Proses yang dilakukan sistem untuk pengujian yaitu praproses, proses kombinasi dan menghitung nilai Smoothing Dirichlet Naïve Bayes. Pengujian dilakukan menggunakan confusion matrix dengan 180 data email sebagai data latih dan 25 data email sebagai data uji. Hasil Pengujian menggunakan Teori Kombinasi dan Metode Smoothing Dirichlet Naïve Bayes untuk mengklarifikasi email spam yaitu memiliki nilai akurasi sebesar 84% dan Metode Smoothing dirichlet Naïve Bayes saja dengan akurasi sebesar 88%.
Ringkasan Alternatif
Email spam is abusing of electronic mail system to send mails which will waste time to delete those kind of mails and consume storage capacity. Based on that problem, needed a spam filter to handle email spam. The Method used to develop spam filter is Smoothing Dirichlet Naïve Bayes Method. That Method will combine with Combination Theory in this research because assumed can recognize subject email spam word pattern. The calculation value of Smoothing Dirichlet Naïve Bayes will be execute to every combination of words formed. On the analysis process is used email data from Spamassassin web with prefix code Ãâ20030228Ãâ. The parameters used in the analysis of this classification is subject email. Preprocessing is performed such as reading the mail file, tokenisation, and stopword deletion. Preprocessing stage is to prepare the data to be used in the primary process. Adding extra training data on the system perform preprocessing stage and process combinations. The process performed by the testing system that is preprocessing, process and calculate the value of a combination of Naïve Bayes Smoothing Dirichlet. Testing perfomed using confusion matrix with 180 email as training datas and 25 email as testing datas. Test results using a combination Theory and Methods Smoothing Dirichlet Naïve Bayes to clarify the spam email that has an accuracy value of 84% and Smoothing Methods Dirichlet Naïve Bayes only with an accuracy of 88%.