Logo Eventkampus
Perpustakaan judul masih dalam tahap pengembangan, admin siap menampung kritik dan saran
Perbandingan Beberapa Metode Term Weighting Pada Latent Semantic Analysis Untuk Automated Short Answer Scoring
Waffi Fatur Rahman (2018) | Skripsi | Teknik Informatika , Teknik Komputer
Bagikan
Ringkasan
Proses Automated Short Answer Scoring (ASAS) pada dasarnya merancang sebuah program komputer yang mampu mengukur tingkat kesamaan kalimat antara "kunci jawaban" dan "jawaban siswa". ASAS terkait erat dengan text similarity. Salah satu pendekatan untuk text similarity adalah Latent Semantic Analysis (LSA). Pada proses term weighting, pemilihan metode local dan global term weighting memberikan efek yang signifikan terhadap performa LSA. Penelitian ini membandingkan performa dari LSA menggunakan metode term weighting TF-IDF, WIDF, dan MIDF. Terdapat 100 skenario rank-k SVD matriks dimana antara 220 sampai 375 memberikan hasil terbaik dan untuk menghitung performa terdapat 3 skenario variasi kelas (2, 3, dan 6 kelas). Metode term weighting WIDF dan MIDF lebih baik dari TF-IDF dalam seluruh pengukuran evaluasi (korelasi, MAE, dan performa). Metode term weighting WIDF dominan lebih baik daripada MIDF berdasarkan korelasi dan MAE, walaupun MIDF dapat menghasilkan rata-rata korelasi yang sedikit lebih tinggi yang menyebabkannya memiliki performa lebih baik dari WIDF pada skenario variasi kelas dengan 3 dan 6 kelas. Tetapi pada skenario dengan variasi 3 kelas, WIDF dapat memberikan akurasi lebih baik dari MIDF. Oleh karena itu, WIDF dominan lebih baik dari MIDF maka WIDF direkomendasikan untuk digunakan dalam kasus ASAS menggunakan LSA. Kata Kunci: Latent Semantic Analysis, term weighting, TF-IDF, WIDF, dan MIDF.
Ringkasan Alternatif
The Automated Short Answer Scoring (ASAS) process essentially designs a computer program that be able to measure the level of sentence similarity between "answer keys" and "student answers". ASAS is closely related to text similarity. One approach to text similarity is Latent Semantic Analysis (LSA). In the process of term weighting, the selection of local and global methods of weighting gives a significant effect on the performance of LSA. This study compare the performance of LSA using TF-IDF, WIDF, and MIDF term weighting methods. There are 100 k matrix reduction scenarios in which between 220 and 375 provide the best results and to calculate the performance there are 3 scenarios of class variation (2, 3, and 6 classes). The weighting methods WIDF and MIDF is better than TF-IDF in all evaluation measurements (correlation, MAE, and performance). The dominant WIDF term weighting method is better than MIDF based on correlation and MAE, although MIDF can produce slightly higher correlation averages that make it perform better than WIDF in class variation scenarios with 3 and 6 classes. But in the scenario of 3-class variation, WIDF can provide better accuracy than MIDF. Therefore, WIDF is predominantly better than MIDF then WIDF is recommended for use in the case of ASAS using LSA. Keywords: Latent Semantic Analysis, term weighting, TF-IDF, WIDF, dan MIDF.
Sumber