Logo Eventkampus
Perpustakaan judul masih dalam tahap pengembangan, admin siap menampung kritik dan saran
Pembangkit Pertanyaan Otomatis Untuk Teks Berbahasa Indonesia Berdasarkan Template Sintaksis
Muhammad Raihan Iqbal NIM. (2016) | Skripsi | Teknik Informatika
Bagikan
Ringkasan
Penelitian pembangkit pertanyaan sudah banyak dilakukan untuk mengatasi masalah-masalah yang berkaitan dengan pemahaman teks. Penelitian pembangkit pertanyaan teks bahasa Indonesia yang sudah dilakukan dengan menggunakan metode template dan berhasil membangkitkan kata tanya "apa yang dimaksud", "mengapa", dan "bagaimana". Tetapi dalam penelitian tersebut masih ada kata tanya yang belum teratasi, seperti "siapa", "apa", "mana", dan "kapan". Oleh karena itu, penelitian ini bertujuan untuk membangkitkan pertanyaan dengan kata tanya tersebut menggunakan template sintaksis. Template sintaksis adalah template yang dibentuk berdasarkan fungsi-fungsi sintaksis pada tata bahasa Indonesia, yaitu subjek, predikat, objek, dan keterangan. Untuk menggunakan template tersebut diperlukan lima tahapan awal, case folding, tokenisasi, stemming, deteksi jenis kata, dan analisis sintaksis. Case folding adalah merubah case pada semua huruf dalam teks menjadi lower case. Tokenisasi adalah mendapatkan token-token berupa kata dari teks. Stemming adalah proses mencari kata dasar dan imbuhan dalam suatu token. Deteksi jenis kata adalah proses untuk mencari jenis kata yang sesuai pada suatu kata seperti kata benda, kata kerja, dan lain sebagainya. Analisis sintaksis adalah proses menentukan fungsi-fungsi sintaksis pada tiap kata. Setelah mendapatkan fungsi-fungsi sintaksis, maka template sintaksis dapat digunakan. Hasil pengujian pada prototype yang dibangun menunjukkan prototype ini memiliki akurasi sebesar 14,53 % dengan menggunakan enam teks masukan yang berasal dari buku pelajaran Bahasa Indonesia kelas dua sekolah dasar. Alasan mendapatkan akurasi tersebut adalah masih banyaknya struktur kalimat yang belum teratasi, tidak mengenal nama (nama orang, nama jalan, dan lain lain), ambiguitas, dan tidak lengkapnya kamus yang digunakan.
Ringkasan Alternatif
Research about question generation has been conducted many times to overcome problems related with reading comprehension. Question generation researches in Indonesian reading has been done using "template method", and was successful to generate "What is the meaning of", "Why", and "How". But there are still some question marks that haven't overcomed yet, like "Who", "What", "Where", and "When". Therefore, this research is conducted to generate questions with those question marks using "syntax template". Syntax template is a template based on syntax functions in Indonesian grammar: subject, verb, object, and adjective/adverb. To use the template, 5 initial steps are needed: case folding, tokenization, stemming, word type detection, and syntax analysis. Case folding is to change case on all letter in text into lower case. Tokenization is to get tokens in the form of words from a reading text. Stemming is a process to look for the word's base and affix(s) in a token. Word type detection is a process to look for the compatible word type for a word, such as noun, verb, etc. Syntax analysis is determining syntax functions in a word. After the syntax functions are obtained, the syntax template can be used. Test result on the prototype built shows that this prototype has 14,53% accuracy by using six reading text from Indonesian textbook for elementary school grade 2. The reason of result is there are still so many sentence structure that haven't been overcomed, not recognizing names (people's name, street names, etc), ambiguity, and incomprehensive vocabulary used.
Sumber