Perpustakaan judul masih dalam tahap pengembangan, admin siap menampung kritik dan saran
Implementasi Ekstraksi Informasi Pada Surat Masuk Menggunakan Metode Naive Bayes
Chandra Ratiwi NIM. (2018) | Skripsi | Teknik Informatika , Teknik Informatika , Teknik Informatika
Bagikan
Ringkasan
Ekstraksi informasi merupakan suatu metode dari text mining yang bertujuan untuk mencari, mengambil ataupun mengolah informasi - informasi yang terkandung dalam suatu objek. Pada hasil penelitian ekstraksi informasi pada dokumen sebelumnya memiliki kelemahan yang karena metode rule-based harus memiliki dokumen yang terstruktur dan terformat, maka dalam penelitian ini akan digunakan metode Naive Bayes sebagai algoritma machine learning untuk mengekstraksi informasi dengan pengklasifikasian setiap kalimat yang terdapat pada surat masuk,karena surat masuk tidak selalu identik dengan format yang sudah ada. Sebelum surat di klasifikasikan oleh naive bayes surat akan melalui proses preprocessing terlebih dahulu yang terdiri dari filtering,tagging,dan tokenization. Setelah preprocessing dilakukan data diberi nilai bobot pada setiap fitur yang terdapat pada teks kalimat untuk perhitungan probabilitas Naive Bayes. Berdasarkan hasil pengujian confusion matrix didapatkan hasil yang cukup baik dan dapat disimpulkan bahwa algoritma Naive Bayes dapat diterapkan untuk sistem ekstraksi informasi pada surat masuk dengan hasil akurasi yang sangat tinggi yakni 96,96%.
Ringkasan Alternatif
Information extraction is a method of text mining that aims to find, retrieve or process information which contained in an object. Based on the results of information extraction previous research, document has a deficiency that rule-based method must have a structured and formatted document. Based on the existing problem, in this study the Naive Bayes method will be used as a machine learning algorithm to extract information by classifying sentence by sentence which contained in the incoming letter, because incoming mail is not always identical to the existing format. Before the letter is classified by Naive Bayes the letter will go through to text preprocessing which consists of filtering, tagging, and tokenization. After preprocessing the data is given a weight value for each feature based on sentence text which found in the letter for the probability calculation of Naive Bayes. Based on the results of the confusion matrix test, the results are really good and it can be concluded that the Naive Bayes algorithm can be applied to information extraction systems on incoming letters with very high accuracy results of 96.96%.