Logo Eventkampus
Perpustakaan judul masih dalam tahap pengembangan, admin siap menampung kritik dan saran
Pengenalan Entitas Bernama PAda Teks Bahasa Indonesia Menggunakan Conditional Random Fields
Narti Jaariyah NIM. (2017) | Skripsi | Teknik Informatika
Bagikan
Ringkasan
Pengenalan entitas bernama merupakan suatu proses untuk mengklasifikasi entitas nama seperti nama orang, lokasi, organisasi, waktu, dan kuantitas pada suatu teks. Pengenalan entitas bernama pada teks bahasa Indonesia sudah dilakukan menggunakan metode Hidden Markov Model. Namun pada penelitian berikutnya dilakukan pengembangan terhadap metode HMM yakni metode Conditional random fields yang diharapkan dapat melakukan pengenalan entitas benama lebih baik daripada HMM. Conditional random fields memiliki banyak kelebihan dibandingkan metode Hidden Markov Model dan Maximum Entropy Markov Model. Hal ini terbukti pada penerapan pengenalan entitas bernama menggunakan metode CRF untuk berbagai bahasa menghasilkan nilai akurasi yang tinggi. Simulator pengenalan entitas bernama dibuat untuk menguji seberapa baik CRF dalam mengenali entitas bernama. Fitur yang digunakan adalah kelas kata sekarang, kelas kata sekarang dan kelas kata sebelumnya, dan kelas kata sekarang, kelas sebelumnya, dan kelas kata setelahnya. Penilaian simulator menggunakan f-measure dengan cara membandingkan label entitas hasil simulator dengan jenis entitas yang sebenarnya. Hasil akurasi terbaik yang didapatkan menggunakan data latih dan data uji yang sama sebesar 90.53% dengan recall 63.09% dan precision 31.55% sedangkan pengujian yang menggunakan data latih dan data uji yang berbeda menunjukkan nilai akurasi terbaik adalah 90.06% dengan recall dan precision adalah 68.38% dan 41.35%.
Ringkasan Alternatif
Named entity recognition is a process for classifying entities such as the name of the person's name, location, organization, time, and quantity on a text. The introduction of the entities named in the Indonesian language text has been done using Hidden Markov Model. But in subsequent studies conducted on the development of the HMM method Conditional Random Fields that are expected to perform named entity recognition is better than HMM. Conditional random fields has many advantages over methods of Hidden Markov Models and Maximum Entropy Markov Model. This was evident in the implementation of named entity recognition method for multiple languages CRF produces high accuracy values. Simulator named entity recognition was made to test how well the CRF in recognizing named entities. Features that use is current word part-of-speech, current word part-of-speech and previous part-of-speech, and current word part-of-speech, previous part-of-speech, and next part-of-speech. Rate simulator using the f-measure by comparing the entity label simulator results with actual entity type. Results best accuracy obtained using the training data and test data the same at 90.53% with recall 63.09% and precision 31.55% while testing using training data and test data of different shows its value best accuracy is 90.06% with recall and precision is 68.38% and 41.35%.
Sumber