Perpustakaan judul masih dalam tahap pengembangan, admin siap menampung kritik dan saran
Ekstraksi Informasi Dokumen Karya Tulis Ilmiah Menggunakan Learning Vector Quantization
Firdamdam Sasmita NIM. (2018) | Skripsi | Teknik Informatika , Teknik Informatika
Bagikan
Ringkasan
Pendeteksian setiap komponen dokumen karya tulis ilmiah sulit dilakukan untuk dokumen yang memiliki format beragam. Permasalahan tersebut dapat diatasi jika menggunakan machine learning. Algoritma machine learning yang digunakan pada penelitian ini adalah LVQ. Algoritma LVQ merupakan salah satu bagian algoritma dari Jaringan Syaraf Tiruan. Dengan algoritma tersebut, setiap komponen yang ada pada dokumen karya tulis ilmiah akan dipelajari terlebih dahulu oleh algoritma LVQ, kemudian dilakukan pengujian untuk mengekstraksi komponen-komponen pada dokumen karya tulis ilmiah. Berdasarkan pengujian pada 40 dokumen karya tulis ilmiah skripsi tahun 2011 sampai 2018, diperoleh rata-rata akurasi dengan bentuk pengujian token-kelas sebesar 78%. Perolehan akurasi token-kelas disebabkan oleh penggunaan fitur pembobotan. Sedangkan, akurasi dengan bentuk pengujian kelas-token diperoleh sebesar 6%. Rendahnya akurasi kelas-token disebabkan oleh pengaruh algoritma LVQ, salah ejaan, dan munculnya simbol tidak beraturan.
Ringkasan Alternatif
Detecting of each component in scientific paperwork is difficult for documents that have various formats. These problems can be overcome if using machine learning. The machine learning algorithm used in this research is LVQ. The LVQ algorithm is a part algorithm of Artificial Neural Networks. With this algorithm, each component in the scientific paperwork document will be studied first by the LVQ algorithm, then tested to extract the components in the scientific writing document. Based on the testing of 40 thesis scientific papers in 2011 to 2018, the average accuracy of the token-class test form was 78%. The acquisition of token-class accuracy is caused by the use of the weighting feature. Meanwhile, the accuracy with the form of class-token testing was obtained at 6%. The low accuracy of class-tokens is caused by the influence of LVQ algorithms, misspellings, and the appearance of irregular symbols.