Perpustakaan judul masih dalam tahap pengembangan, admin siap menampung kritik dan saran
Text Summarization Dengan Metode K Means pada Artikel Berita Berbahasa Indonesia
Agus Riyanto NIM. (2016) | Skripsi | Teknik Informatika
Bagikan
Ringkasan
Perkembangan teknologi semakin pesat menyebabkan kebutuhan akan informasi yang sangat besar dan tidak terbatas, terutama informasi dalam bentuk jurnal, artikel, dan berita. Artikel yang ada pada situs portal berita umumnya bersifat real time dan up to date yang menyebabkan artikel berita memiliki jumlah kalimat/paragraf yang sangat banyak[4]. Dengan adanya sistem peringkasan teks otomatis diharapkan pembaca akan lebih mudah untuk memahami dan mengetahui isi dari berita tersebut. Preprocessing dilakukan penyiapan dokumen mentah menjadi dokumen atau representatif dokumen yang siap diproses untuk langkah selanjutnya[5]. Pada tahap ini proses yang dilakukan antara lain membagi dokumen menjadi kalimat, casefolding, filtering, dokumen menjadi kata (tokenizing), dan menghapus stopword. Penerapan metode TF-IDF bertujuan untuk menghitung bobot tiap kalimat dan pada metode K-Mean Clustering bertujuan untuk meminimalisasikan variasi kalimat di dalam suatu cluster dan memaksimalisasikan variasi kalimat antar cluster. Pemilihan kalimat penting berdasarkan nilai terbesar dari tiap Cluster/kelompok merupakan hasil dari ringkasan yang dihasilkan oleh sistem peringkasan teks otomatis. Pengujian hasil ringkasan sistem menghasilkan rata-rata recall 57,74%, precision 45,5%, dan f-measure 46,13%.
Ringkasan Alternatif
Rapid technological developments led to the need for information is enormous. Especially information in the form of journals, articles, and news. No article on general news portal site in real time and up to date news articles have caused the number of sentences / paragraphs which is very much [4]. With a system of automatic text summarization expected readers would be easier to understand and know the contents of the news. Preprocessing is preparation of raw documents into a document or documents representative who is ready to process to the next step [5]. At this stage of the process undertaken include dividing the document into sentences, casefolding, filtering, document being tokenizing, and remove the stopword. Application of TF-IDF method aims to calculate the weight of each sentence and the K-Mean Clustering method aims to minimize variation of the phrase in a cluster and maximize inter-cluster variation sentence. Selection of important sentences based on the largest value of each Cluster is the result of the summary produced by the automatic text summarization captions. The test results summary system produces an average of 57.74% recall, precision 45.5% and 46.13% f-measure.
Sumber
Judul Serupa
- Implementasi Text Summarization Menggunakan Metode Vector Space Model Pada Artikel Berita Berbahasa Indonesia
- Text Summarization Menggunakan Metode KNN dan MMR Pada Artikel Berbahasa Indonesia