Logo Eventkampus
Perpustakaan judul masih dalam tahap pengembangan, admin siap menampung kritik dan saran
Perbandingan Metode Smoothing Untuk Deteksi Dan Koreksi Kesalahan Kata Dalam Teks Berbahasa Indonesia
Fernando Shole NIM. (2018) | Skripsi | Teknik Informatika , Teknik Informatika , Teknik Informatika
Bagikan
Ringkasan
Dalam Topik NLP (Natural Language Processing), kesalahan kata merupakan hal yang penting untuk diperhatikan. Beberapa penelitian telah dilakukan untuk mengatasi masalah kesalahan ejaan real-word dalam bahasa Inggris. Skripsi Muhammad Aburizal Siregar telah mengatasi masalah kesalahan ejaan real-word dalam bahasa Indonesia yaitu deteksi dan koreksi kesalahan kata real-word memiliki akurasi sebesar 11% setelah mengubah perhitungan probabilitas n-gram dengan menggunakan metode additive smoothing. Oleh karena itu, penelitian ini bertujuan untuk membandingkan akurasi metode deteksi dan koreksi kesalahan ejaan real-word dalam bahasa Indonesia menggunakan metode smoothing Good-Turing estimate, Jelinek-Mercer, Katz smoothing, Witten-Bell dan Absolute discounting untuk kasus deteksi dan koreksi kesalahan real-word dalam bahasa Indonesia. Dari hasil pengujian pada 30 artikel berita menggunakan korpus sebesar 21,5 didapatkan akurasi yang paling tinggi adalah metode Absoulte Discounting pada akurasi deteksi sebesar 80%, dan Jelinek Mercer pada akurasi koreksi sebesar 89% dan hasil akurasi metode smoothing yang paling rendah adalah metode Good-turing dengan akurasi deteksi dan koreksi sebesar 0%.
Ringkasan Alternatif
In NLP Topics (Natural Language Processing), word errors are important to note. Several studies have been done to overcome the problem of real-word spelling errors in English. Thesis Muhammad Aburizal Siregar has overcome the problem of real-word spelling mistakes in the Indonesian language of detection and correction of real-word word error has an accuracy of 11% after changing the calculation of n-gram probability by using the additive smoothing method. Therefore, this study aims to compare the accuracy of detection methods and correction of real-word spelling errors in Indonesian using Smoothing Good-Turing estimate, Jelinek-Mercer, Katz smoothing, Witten-Bell and Absolute discounting for case detection and correction of real errors -word in Indonesian. From the test results on 30 news articles using the corpus of 21.5 obtained the highest accuracy is the Absolute Discounting method on the detection accuracy of 80%, and Jelinek Mercer on accuracy of 89% correction and the accuracy of the smoothing method is the lowest method of Good- Turing with the accuracy of detection and correction is 0%.
Sumber