Perpustakaan judul masih dalam tahap pengembangan, admin siap menampung kritik dan saran
Penilaian Esai Otomatis Menggunakan Kategorisasi Teks Dengan Metode K-Nearest-Neighbor
Muhammad Rheza Fadillah (2018) | Skripsi | Teknik Informatika , Teknik Komputer
Bagikan
Ringkasan
Penilaian esai otomatis adalah penetapan atau pemberian nilai terhadap esai menggunakan program komputer khusus. Terdapat beberapa metode dalam mengimplementasikan sistem penilaian esai otomatis salah satunya adalah k-Nearest-Neighbor (k-NN). Penelitian esai otomatis menggunakan metode k-NN telah dikembangkan oleh Bin. Penilaian yang dimaksud adalah proses mengategorisasikan esai yang dilakukan oleh mesin ke dalam kategori nilai yang telah ditentukan oleh penilai manusia. Terdapat beberapa masalah pada penelitian Bin yaitu baru menerapkan preprocessing stoprword removal dan data yang digunakan berjumlah 271. Pada penelitian ini dilakukan penambahan data dan penambahan tahap preprocessing menjadi case folding, tokenizing, stopword removal, stemming dan n-gram sehingga akurasi meningkat. Penelitian dilakukan terhadap dua sampel esai persuasif bahasa Inggris berbasis teks yang diambil dari dua sumber yaitu Bin dan kaggle.com. Data Bin berjumlah 271 esai dan data kaggle berjumlah 1780 esai. Informasi pribadi pada masing-masing esai telah dihilangkan menggunakan Named Entity Recognizer (NER). Dengan penambahan preprocessing terjadi peningkatan akurasi pada masing-masing sampel data. Pada data Bin, Akurasi tertinggi mencapai 85.19%. Disamping itu, akurasi tertinggi pada data kaggle mencapai 73.33%. Peningkatan akurasi juga terlihat setelah penambahan data yang dilakukan terhadap data kaggle dengan teknik arithmetic sampling, rata-rata akurasi tertinggi mencapai 64.55%. Kata kunci: k-NN, preprocessing, case folding, tokenizing, stopword removal, stemming, n-gram.
Ringkasan Alternatif
Automated essay scoring is marking of the essays using a special computer program. There are several methods for implementing automated essay scoring system one of which is k-Nearest-Neighbor (k-NN) method. Automated essay scoring research using the k-NN method has been developed by Bin. Assessment is the process of categorizing essays by machine into the category that has been determined by human assessors. There were several problems in previous studies that it just applied preprocessing stoprword removal and data used was 271. In this study it was add data and preprocessing became case folding, tokenizing, stopword removal, stemming and n-grams to improve accuracy. Research conducted on two samples of persuasive essays based English text taken from two sources, namely Bin and kaggle.com. The Bin data totaled 271 essays and the kaggle data totaled 1780 essays. Personal information on each essays have been removed using the Named Entity Recognizer (NER). By the addition of preprocessing there was an increase the accuracy on each data sample. The highest accuracy reached 85.19% on the Bin data. In addition, accuracy reached 73.33% on the kaggle data. Improved accuracy was also shown after the adding data on the kaggle data with arithmetic sampling technique, the highest average accuracy reached 64.55%. Keywords: k-NN, preprocessing, case folding, tokenizing, stopword removal, stemming, n-grams.