Perpustakaan judul masih dalam tahap pengembangan, admin siap menampung kritik dan saran
Analisis Penerapan Metode Lexical Chain Pada Peringkasan Otomatis Dokumen Tunggal Menggunakan Neo4j
Moch. Arief Febriansyah (2019) | Skripsi | Teknik Informatika , Teknik Komputer
Bagikan
Ringkasan
Lexical chain merupakan rantai-rantai kata/prasa yang terbentuk berdasarkan keterhubungan antar kata berdasarkan arti kata. Kemudian konsep ini diterapkan pada peringkasan otomatis untuk mendapatkan kalimat penting dengan teknik extractive summarization. Penelitian ini akan melihat keterhubungan antar struktur kalimat dengan hasil ringkasan. Dokumen yang dipilih berupa berita agar lebih terfokus dalam satu jenis dokumen dan struktur kalimatnya. Selain itu, hal yang perlu diperhatikan adalah penghitungan skor rantai sebelum proses ekstraksi kalimat. Penelitian ini bertujuan untuk melihat keterhubungan antara struktur kalimat dan pengaruh penghitungan skor rantai dengan mempertimbangakan sinonim kata terhadap skor rantai serta hasil ringkasan. Dilakukan peringkasan terhadap 50 dokumen berita dari dataset BBC News 2004-2005, 2 artikel dan 2 berita dari penelitian Barzilay dan Elhadad. Hasil dari eksperimen didapatkan bahwa ringkasan berita memiliki keterhubungan antara struktur kalimat terhadap hasil ringkasan. Kemudian untuk penghitungan skor dengan sinonim kata terhadap hasil ringkasan belum terlihat berpengaruh signifikan dikarenakan hanya mempengaruhi satu dokumen dari BBC News. Namun untuk skor rantai semua dokumen memiliki perubahan yang signifikan, maka dapat disimpulkan bahwa rantai akan memiliki skor yang tinggi dengan artian bahwa rantai memiliki keterhubungan kata yang kuat. Kata Kunci: lexical chain, peringkasan otomatis, extractive summarization, graph database neo4j, dataset BBC News.
Ringkasan Alternatif
Lexical chain is a words/phrases chain connected based on its definition. This concept is then applied for automatic summarization to obtain the main idea through extractive summarization. This research will observe the connectivity between structure of sentence and the result of summarization. In order to maintain the focus of summarization, news are selected as the sample since the sentences are most likely more focused within a certain news article. Another thing that must be noticed is the chain-score determination prior to sentence extraction. This research aims to observe the relation between sentences structure and the effect of chain scoring by considering words synonym against chain score and its summary. Summarization is conducted to 50 news documents from BBC News during 2004- 2005, in conjuction with 2 news articles and 2 articles from Barzilay and Elhadad research. Experiment shows, there is a connection between sentence structure and summary news. And then for the synonym based scoring towards summary results, there is no apparent effect since it is only one document of BBC. However, for the chain score, all documents have significant change, therefore it can be concluded that chain will have a high score if each of its member has strong relation towards each others. Keywords: lexical chain, automatic summarization, extractive summarization, graph database neo4j, BBC News dataset.