Perpustakaan judul masih dalam tahap pengembangan, admin siap menampung kritik dan saran
Peringkasan Otomatis Teks Berita Berbahasa Indonesia Menggunakan Naive Bayes Classifier dan Maximum Marginal Relevance
Magdalena Vaenlie Monita (2018) | Skripsi | Teknik Informatika , Teknik Komputer
Bagikan
Ringkasan
Berita online umumnya bersifat real time dan up to date yang menyebabkan pembaca memerlukan banyak waktu untuk membaca berita agar dapat mengikuti perkembangan berita tersebut. Salah satu solusi agar pembaca dapat membaca berita dengan cepat adalah dengan membuat ringkasan dari berita. Ringkasan yang dihasilkan secara manual membutuhkan waktu yang cukup lama. Oleh karena itu, ringkasan yang dihasilkan dengan menggunakan sistem peringkasan otomatis teks banyak dikembangkan. Penelitian ini menghasilkan ringkasan secara ekstraktif yang dilakukan pada teks berita berbahasa Indonesia dengan menggunakan 2 metode yakni metode naive bayes classifier dan metode Maximun Marginal Relevance. Data berita yang digunakan berasal dari situs kompas.com dengan kategori ekonomi yang sudah memiliki ringkasan manual yang berasal dari 3 ahli bahasa Indonesia. Peringkasan otomatis teks berita dilakukan dengan membagi data ke dalam dua bagian yakni data latih dan uji. Data uji diklasifikasikan menggunakan pengetahuan yang dihasilkan dari data latih. Setelah itu kalimat hasil klasifikasi akan dihitung dan disusun kembali dengan metode maximum marginal relevance (MMR). Kalimat disusun berdasarkan nilai MMR tertinggi. Kemudian kalimat yang diambil sebesar 30% dari nilai compression rate tertinggi. Untuk mengetahui kualitas ringkasan yang dihasilkan, maka dilakukan evaluasi terhadap ringkasan. Evaluasi pada penelitian menggunakan 3 nilai yakni nilai precision, recall, dan f-measure. Ketiga nilai ini merupakan nilai yang merepresentasikan performa dari sistem peringkasan. Dari hasil eksperimen yang dilakukan dengan menggunakan metode naive bayes classifier dan MMR menghasilkan performa sebesar 26,86%, sedangkan dengan hanya menggunakan naive bayes classifier performa yang dihasilkan sebesar 23,61%. Penambahan metode MMR dalam sistem peringkasan ini memberikan hasil yang baik yakni dengan meningkatnya nilai precision sebesar 3,77%, recall sebesar 2,91%, dan nilai f-measure sebesar 3,25%. Oleh karena itu dapat disimpulkan bahwa peringkasan otomatis teks berita berbahasa Indonesia menggunakan naive bayes classifier dan MMR memberikan performa yang lebih baik dibandingkan dengan hanya menggunakan naive bayes classifier. Kata kunci: peringkasan otomatis teks, berita berbahasa Indonesia, naive bayes classifier, dan maximum marginal relevance.
Ringkasan Alternatif
Generally, online news is real time and up to date that makes the readers take a lot of time to read the news to keep up them informal. One of the solutions so that the readers can read news quickly is to create news summary. News summary can be generated manually or computer aided. Therefore, a summary generated using automatic text summarization is widely developed. This study produced an extractive summary which is done on Indonesian news by using two methods namely naive bayes classifier and maximum marginal relevance (MMR). All the news are taken from kompas.com with economic category that had been manually summarized by three Indonesian language experts. Automatic text summarization is performed by dividing data into training and testing data. Testing data is classified using knowledge from training data. After that the classification texts are calculated and reassembled using MMR. Sentences are arranged based on the highest MMR. And then take all sentences that has 30% highest compression rate. The quality of summary is evaluated by using 3 value that is precision, recall and f-measure. These three values are the values that represent the performance of the summary system. The result show that using naive bayes classifier and maximum marginal relevance the performance is 26.86%, while using only naive bayes classifier the performance is 23.61%. The addition of MMR method in the system gave a good result with increasing of precision value about 3,77%, recall 2,91%, and f-measure value about 3,25%. Therefore, it can be concluded that automatic text summarization using naive bayes classifier and MMR provides better performance than using only naive bayes classifier. Keywords: automatic text summarization, Indonesian news, naive bayes classifier, and maximum marginal relevance.