Logo Eventkampus
Perpustakaan judul masih dalam tahap pengembangan, admin siap menampung kritik dan saran
Implementasi Support Vector Machine (SVM) Dan Maximal Marginal Importance (MMI) Untuk Peringkasan Multi Dokumen Artikel Berbahasa Indonesia
Novriana NIM. (2017) | Skripsi | Teknik Informatika
Bagikan
Ringkasan
Artikel berita memiliki pandangan dan cara penyampaian informasi yang berbeda-beda mengenai satu topik berita yang sama, selain itu berita juga berasal dari lebih dari satu sumber berita dan kebanyakan membahas mengenai berita yang sama namun dengan tata bahasa yang berbeda sesuai dengan pemuat berita. Ringkasan artikel berita dapat membantu pembaca untuk mendapatkan informasi yang penting dari berita. Peringkas teks otomatis multi dokumen artikel berbahasa Indonesia yang dilakukan pada penelitian ini terdiri atas beberapa tahapan, yaitu : preprocessing, ekstraksi fitur, training dan klasifikasi kalimat relevan dan non relevan menggunakan support vector machine (SVM), serta tahap pembentukan ringkasan menggunakan maximal marginal importance (MMI). Artikel yang digunakan pada penelitian ini berupa artikel berita berbahasa Indonesia dan memiliki kesamaan topik. Preprocessing yang digunakan berupa pemecahan kalimat, case folding, tokenizing dan filtering(stopword). Sedangkan fitur-fitur kalimat yang digunakan adalah fitur panjang kalimat, fitur posisi kalimat, fitur data numerik, fitur kata-kata thematik, fitur kemiripan kalimat menyerupai judul, fitur kemiripan kalimat dengan kalimat lain, serta fitur ikatan leksikal dengan kalimat sebelum dan sesudahnya. Pada tahapan training dan klasifikasi digunakan LibSVM dengan menggunakan kernel Radial Basis Function (RBF) dimana nilai parameter C dan sebesar 1 dan 0.5. Pada tahap klasifikasi akan didapat kalimat yang relevan dan non relevan dari artikel yang akan diringkas. Setelah didapatkan kalimat relevan dan non relevan, akan dilakukan pembentukan ringkasan dari hasil kalimat relevan dengan menggunakan metode maximal marginal importance (MMI). Pada proses evaluasi dilakukan dengan melakukan perbandingan antara ringkasan yang dihasilkan oleh sistem dengan ringkasan manual yang dihasilkan oleh abstractor untuk mendapatkan nilai performansi recall, precision dan f-measure. Dari pengujian yang telah dilakukan, didapatkan nilai performansi recall sebesar 55.2%, precision 56% dan f-measure sebesar 53.65%.
Ringkasan Alternatif
A news article has a perception and a way to convey information thatÂ’s different about the same news topics, moreover article news also comes from more than one source of news and most discussed on the same news but with different grammar according to the news maker. Summarization of news article can helps the reader to getting the importance information from that. In this research automatic text summarization makes by using extractive approach. It use for multi document articles in Indonesian language, with several process thatÂ’s: preprocessing, feature extraction, training and classifier relevant and non-relevant sentence using support vector machine (SVM), and the stages to generate summarization using maximal marginal importance (MMI. The articles which use in this research is the articles with same news topics. Preprocessing stages consists of sentence segmentation, case folding, tokenizing and filtering. Next process will calculate feature to each sentence using sentence length feature, position of sentence feature, feature of numeric data, word thematic feature, similarity of sentence with tittle feature, similarity between sentence feature, lexical bond between previous and next sentence feature. Training and classification stages using LibSVM using Radial Basis Function (RBF) which parameter value C and is 1 and 0.5. In classification stage will getting relevant and non-relevant sentences of articles which will be summarized. After obtained the relevant and non-relevant sentences, system will do generated summarization for relevant sentences using maximal marginal importance method (MMI). Evaluation process doing by comparing summarize by system between summarize by abstractor to get performance value of recall, precision and f-measure. From the test stage performance recall value obtained at 55.2%, precision 56% and f-measure 53.65%.
Sumber