Logo Eventkampus
Perpustakaan judul masih dalam tahap pengembangan, admin siap menampung kritik dan saran
Named Entity Recognition Pada Teks Berbahasa Indonesia Untuk Pembangkit Pertanyaan Otomatis
Rusliani NIM. (2017) | Skripsi | Ilmu Komunikasi
Bagikan
Ringkasan
Pembangkit pertanyaan merupakan sebuah tugas yang secara otomatis membangkitkan pertanyaan dari berbagai macam masukan seperti teks, database, atau aliran semantic. Pada penelitian sebelumnya, pembangkit pertanyaan otomatis dengan menggunakan template berdasarkan analisis sintaksis telah berhasil dilakukan untuk kalimat tanya “siapa”, “apa”, “mana”, dan “kapan”. Penelitian ini menghasilkan akurasi yang masih rendah yaitu sebesar 14,53%. Hal ini dikarenakan belum adanya pendeteksian nama, ambiguitas yang belum bias teratasi, kamus yang digunakan masih belum lengkap, dan pencarian fungsi sintaksis yang belum sempurna.Dalam mengatasi masalah tersebut, pada penelitian ini menggunakan NER untuk mengatasi pendeteksian nama dengan metode HMM. Proses yang dilakukan terdiri dari preprocessing; tokenisasi kalimat, tokenisasi kata, dan POS tag. Kemudian data dilatih dengan metode HMM. Dalam penelitian ini, konfigurasi yang dilakukan ada 3 (tiga), yaitu konfigurasi kelas kata terhadap kata tersebut, kelas kata terhadap kata tersebut dan kata sebelumnya, dan kelas kata terhadap kata tersebut, kata sebelum, dan setelahnya. Berdasarkan hasil pengujian menggunakan data sebanyak 28992 tag entitas, didapatkan hasil nilai recall sebesar 0.0043, precision sebesar 0.1249, dan f-measure sebesar 0.0083, akurasi relevansi pelabelan kata sebesar 42,54% dan relevansi pertanyaan sebesar 19,71%.
Ringkasan Alternatif
Generating question is a task that automatically raises the question of a wide range of input such as text, database, or semantic flow. In previous research, generating automated queries by using a template based on syntactic analysis has been successfully performed or questions of "who", "what", "where" and "when". This research resulted in accuracy is still low at 14.53%. To overcome this problem, in this study using NER with HMM method. The process is carried out consisting of preprocessing; tokenizing of sentence, tokenizing of words and POS tags. Then the data are trained in methods of HMM. In this study, the configuration is done there are 3 (three), namely class configuration word against the word, the word class of the word and the previous word, and the word against the word class, said before and afterwards. Based on test results using the data as much as 28992 tags entity, the result recall value of 0.0043, precision of 0.1249, and f-measure amounted to 0.0083, and the accuracy of the labeling of the word relevance of 42.54% and the relevance of the question amounted to 19.71%.
Sumber
Judul Serupa
  • Pendeteksian Kalimat Non-Definisi Pada Pembangkit Pertanyaan Otomatis Untuk Teks Berbahasa Indonesia