Perpustakaan judul masih dalam tahap pengembangan, admin siap menampung kritik dan saran
Peringkasan Otomatis Pada Multi Dokumen Menggunakan RVM
Tendi Arifin NIM. (2018) | Skripsi | Teknik Informatika
Bagikan
Ringkasan
Peringkasan teks otomatis pada multi dokumen adalah peringkasan banyak dokumen dengan tema yang sama menggunakan mesin. Penelitian sebelumnya, peringkasan teks otomatis pada multi dokumen dilakukan menggunakan metode Support Vector Machine dengan recall 0.773, precission 0.771, f-measure 0.771. Penelitian Christopher M. Bishop, Michael E. Tipping didapatkan tingkat error SVM lebih tinggi dari RVM yaitu SVM 10,6% dan RVM 9,3%. Tahapan dari peringkasan teks multi dokumen diantaranya penerimaan input teks, preprocessing, pembobotan ekstraksi fitur dengan fitur yang dipakai adalah posisi kalimat, kemiripan antar kalimat, kalimat yang menyerupai judul dokumen, kalimat yang mengandung kata entiti, kalimat yang mengandung data numerik, panjang kalimat, koneksi antar kalimat dan penjumlahan bobot koneksi antar kalimat kemudian pengolahan hasil ekstraksi fitur dengan RVM, pembobotan hasil RVM dengan tf-idf dan disusun menggunakan metode cosine similarity. Berdasarkan hasil pengujian disimpulkan bahwa Metode RVM dapat diterapkan pada Peringkasan Teks Otomatis Pada Multi Dokumen dengan performasi yang cukup kecil yaitu recall sebesar 47.83%, precission sebesar 35.48%, f-measure sebesar 40.74%, dan akurasi sebesar 67.35%.
Ringkasan Alternatif
Auto teks summarization on multi documents is teks summarization many documents with same theme using machine. On the research before, automatic teks summarization on multi documents is using Support Vector Machine methode and the result is recall 0.773, precission 0.771, f-measure 0.771. But on Christopher M. Bishop, Michael E. Tipping research have result Support Vector Machine have higher error than RVM (Relevance Vector Machine) that is SVM 10,6% and RVM 9,3%. Step on teks summarization is recieve document teks input, preprocessing, weighting proces with fitur ekstraktion and the fiturs is sentence postion, sentence similarity, similarity sentence with title of document, sentence have entity word, sentence have numeric data, long sentence, sentence connectivity, and count of sentence weight connection and next step is result of fiture extraction will be process using RVM, weighting again but on this step using tf-idf method and then the sentence will be stacking with cosine similarity method. Based on testing result automatix teks summariztion on multi documents using RVM method have performation result quite small the result is recall is 47.83%, precission is 35.48%, f-measure is 40.74%, dan akuration is 67.35%. it happens because the traing date is not balanced between important sentence and not important sentence.
Sumber
Judul Serupa
- Peringkasan Teks Otomatis Pada Multi Dokumen Menggunakan Textrank