Logo Eventkampus
Perpustakaan judul masih dalam tahap pengembangan, admin siap menampung kritik dan saran
Analisis Dan Perbandingan Stemming Teks Bahasa Indonesia Menggunakan Algoritma Vega Dan Algoritma Cofix-Stripping
Helmi Agustian NIM. (2016) | Skripsi | Teknik Informatika
Bagikan
Ringkasan
Algoritma stemming merupakan sebuah algoritma yang dapat mengubah kata berimbuhan ke bentuk kata dasarnya. Penerapan algoritma stemming diharapkan dapat meningkatkan kemampuan recall, salah satunya pada sistem pencarian dokumen. Recall adalah rasio dari jumlah hasil relevan dari pencarian dibagi semua hasil relevan. Bahasa indonesia yang memiliki struktur morfologi kompleks disebut akan memperoleh keuntungan dalam penerapan stemming pada pencarian dokumen. menurut jurnal karya W.B. Frakes yang menentukan parameter-paramter untuk menghitung stemmer strength. Menghitung stemmer strength dapat memprediksi bagaimana kemampuan recall sebuah algoritma stemming. Melakukan analisis dan perbandingan algoritma vega dan algoritma confix-stripping dengan menghitung parameter stemmer strength. diharapkan dapat mewakili dalam menentukan algoritma terbaik tersebut. Hasil yang didapatkan dari analisis dan perbandingan stemming teks bahasa indonesia menggunakan algoritma vega dan algoritma confix-stripping pada sample dokumen digital library sarihusada adalah, algoritma confix-stipping unggul dalam hal ukuran rata-rata word per conflation class dan index compression factor. Sedangkan algoritma vega unggul dalam hal jumlah kata yang berbeda antara kata masukan dan stem, rata-rata huruf yang dihilangkan untuk membentuk stem, dan terakhir nilai median dan mean modified hamming distance antara kata masukan dan stem.
Ringkasan Alternatif
Stemming algorithm is an algorithm that can transform word to its root word. in the document searching, stemming expected to increase recall. Recall is a fraction of relevant instance that are retrieved. Indonesian language that have complex morphology are more likely to benefit from stemming. Journal writen by W.B.Frakes determine the parameters for calculating the stemmer strength. Calculating the stemmer strength can predict how well the abillity to recall a stemming algorithm. Analysis and comparison vega algorithm and confix-stripping algorithm with calculate stemmer strength parameter, is expected to determine the better algorithm in that matter. The result from analysis and comparison stemming indonesian text using vega algorithm and confix-stripping algoritm using sample from digital library document as follows. Confix-stripping algorithm better in the result from mean number of words per conflation class and index compression factor. Meanwhile vega algorithm better in the result from number of words and stems that differ, mean number of characters removed in forming stems, and the median and mean modified hamming distance between words and their stems
Sumber