Perpustakaan judul masih dalam tahap pengembangan, admin siap menampung kritik dan saran
Pembangunan Kamus Bahasa Indonesia Kata Tidak Baku Menggunakan Algoritma Letent Semantic Indexing Dan Damerau Levenshtein Distance
Jenal Abidin NIM. (2017) | Tesis | Sistem Informasi
Bagikan
Ringkasan
Analisa sentimen atau opinion mining merupakan proses memahami, mengekstrak dan mengolah data tekstual secara otomatis untuk mendapatkan informasi sentimen yang terkandung dalam suatu kalimat opini. Permasalahan dalam analisa sentimen pada media sosial di Indonesia adalah ditemukan banyak kata tidak baku, singkatan, salah ketik dan penggantian huruf vokal menjadi angka. Untuk itu diperlukan sebuah algoritma yang dapat mengenali kata-kata tidak baku, menggabungkan dengan kata baku padanan pada kamus dan memasukan kata tidak baku tersebut ke dalam kamus agar dapat dikenali dengan cepat. Algoritma Damerau-Levenshtein Distance dapat melakukan pengoreksian otomatis dengan menghitung jarak dan memperhatikan pertukaran posisi kata sedangkan algoritma Latent Semantic Indexing (LSI) dapat mencari dan menemukan informasi berdasarkan makna keseluruhan (semantik) bukan hanya makna kata per kata. Di penelitian ini, penggabungan kedua algoritma tersebut terbukti menghasilkan sebuah modul preprocessing teks yang efektif dalam membangun kamus bahasa Indonesia kata tidak baku
Ringkasan Alternatif
Sentimental analysis or opinion mining is the process of comprehending, extracting and processing textual data automatically to obtain information sentiments contained in an opinion sentence. The problem in sentiment analysis from social media in Indonesia is found many non-standard words, abbreviations, typos and vowel replacement into numbers. For that we need an algorithm that can recognize nonstandard words, combining with the standard word equivalent dictionary and inserting the word non-standard into the dictionary to be recognized quickly. Damerau-Levenshtein Distance algorithm can perform automatic correction by calculating distance and paying attention to word position exchange while the Latent Semantic Indexing (LSI) algorithm can searching and finding information based on the overall meaning (Semantics) not just words meaning. In this study, merging the two algorithms proved to produce a text preprocessing module that is effective in building Dictionary of Indonesian non-standard word.