Logo Eventkampus
Perpustakaan judul masih dalam tahap pengembangan, admin siap menampung kritik dan saran
Implementasi Algoritma Cocke -Younger-Kasami (CYK) Dan Levenshtein Untuk Merekomendasikan Perbaikan Struktur Kalimat Dan Kesalahan Pengetikkan Bahasa Indonesia
Mochamad Faras Wahyudipraja NIM. (2016) | Skripsi | Teknik Informatika
Bagikan
Ringkasan
Pada penelitian ini akan dibahas mengenai perbaikan kesalahan kata dan pola kalimat menggunakan algoritma Levenshtein dan CYK. Algoritma CYK merupakan salah satu algoritma yang dapat mengenali apakah sebuah string dapat dikatakan sebagai kalimat yang baku atau tidak sedangkan algoritma Levenshtein merupakan algoritma string matching yang digunakan untuk membandingkan dua buah string dengan menghitung jumlah operasi string yang disebut edit distance. Algoritma CYK biasa digunakan untuk mengenali sebuah kalimat dalam tata bahasa. Tujuan dari penelitian ini adalah untuk mengetahui seberapa efektif implementasi dari kedua algoritma ini dapat memperbaiki kesalahan kata dan pola kalimat. Setiap kata yang ada pada dokumen abstrak akan dikelompokkan terlebih dahulu berdasarkan kelas katanya. Pengelompokkan kata ke dalam kelas kata menggunakan POS Tag Indonesia. Selanjutnya kata yang sudah dikelompokkan akan diperiksa apakah ada kata yang tidak dikenali kelas katanya. Kelas kata yang tidak dapat dikenali oleh POS Tag Indonesia diberi tag X. Kata yang memiliki tag X akan diperbaiki menggunakan algoritma Levenshtein dengan cara membandingkannya dengan kata yang ada pada kamus. Kata yang memiliki edit distance terendah akan dijadikan sebagai saran. Setelah itu, kata dikelompokkan kembali. Tahap selanjutnya, setiap kata yang sudah dikelompokkan akan disusun menjadi pola kalimat dan diperiksa menggunakan algoritma CYK. Apabila pola tersebut tidak dapat dikenali sebagai pola kalimat baku, pola tersebut akan diberikan rekomendasi berdasarkan daftar pola kalimat yang baku. Perbaikan pola kalimat menggunakan algoritma Levenshtein. Hasil pengujian didapatkan tingkat keberhasilan dari rekomendasi perbaikan kata sebesar 86,4% sedangkan untuk rekomendasi perbaikan pola kalimat sebesar 92,3%. Namun pada penelitian ini, rekomendasi perbaikan untuk kata imbuhan yang menunjukkan arah atau nama tempat tidak berhasil dilakukan.
Ringkasan Alternatif
In this study will discussed about words and sentence patterns correction using Levenshtein and CYK algorithms. CYK algorithm is one of kind algorithm that can recognize a string, whether it is acceptable or not while Levenshtein algorithm is string matching algorithm that used to compare two strings by counting the number of operations called edit distance. CYK algorithm is used to recognize a grammar. The purpose of this study is to determine how effectively both of them can correct the words and sentence patterns errors. Every word in the abstract document will be grouped first by its word class. Grouping word is use Indonesian POS Tag. Then, the word has been grouped will be examined whether the word class can be recognized or not. The word class that canÂ’t be recognized by Indonesian POS Tag will get X tag. The word that have X tag will be corrected with Levenshtein algorithm by comparing it with existing word in dictionary. The word that has the lowest edit distance will be used as a suggestion. After that, the word is regrouped. Next, every word that has been grouped will be arranged into a pattern sentence and checked by CYK algorithm. If the pattern canÂ’t be recognized as standard sentence pattern, the pattern will be given recommendation based on a list of standard sentence patterns. Improvement of pattern sentences is using Levenshtein algorithm. The test results is obtained for success rate of improvement recommendations of word is 86.4% while recommendations for improvement sentence patterns is 92.3%. However, the research that has been done, recommendations for words that huddle wasnÂ’t obtained the good results.
Sumber