Perpustakaan judul masih dalam tahap pengembangan, admin siap menampung kritik dan saran
Perbandingan Algoritma Nazief & Adriani dengan Algoritma Enhanced Confix Stripping untuk Stemming Dokumen Teks Bahasa Indonesia
Hurry Mulki F. (2017) | Skripsi | Teknik Informatika , Teknik Komputer
Bagikan
Ringkasan
Information Retrieval (IR) merupakan proses pemisahan dokumen-dokumen yang dianggap relevan dari sekumpulan dokumen yang tersedia. Dengan bertambahnya jumlah dokumen teks yang dapat diakses di internet, maka kebutuhan akan Information Retrieval (IR) yang efektif dan efisien semakin diperlukan. Stemming adalah salah satu cara yang digunakan untuk meningkatkan performa IR dengan cara mentransformasi kata-kata dalam sebuah dokumen teks ke kata dasarnya. Penerapan algoritma stemming untuk satu bahasa berbeda dengan penerapan pada bahasa lainnya. Penelitian ini membandingkan dua stemmers, "Enhanced Confix Stripping"� dan "Nazief & Adriani" untuk bahasa Indonesia. 25 dokumen teks bahasa Indonesia telah dievaluasi. Evaluasi efektivitas dan efisiensi algoritma dilakukan dengan menghitung waktu proses dan presisi masing-masing algoritma. Berdasarkan hasil evaluasi dapat disimpulkan bahwa untuk tujuan linguistik "Enhanced Confix Stripping" lebih tepat dari "Nazief & Adriani"�. Kata kunci: Stemmer bahasa Indonesia, Enhanced confix stripping, Nazief & Adriani.
Ringkasan Alternatif
Information Retrieval (IR) is a process to retrieve relevant documents from a collection of available documents. The increasing amount of text documents on internet causes the increase of the need for effective and efficient IR tools. Stemming is a process transforming all words in text document to their rootword form. Rootword then will be saved as index. Stemming Algorithm for one language can be implemented differently for other languages. This research compares two stemmers, "Enhanced Confix Stripping"� and "Nazief & Adriani"� for Indonesian language. 25 Indonesian language text documents had been evaluated. The evaluation of effectiveness and efficiency of the algorithms is conducted by counting the stemming's process time and precision. Based on the result of the evaluation, it can be concluded that Enhanced Confix Stripping is more appropriate than Nazief & Adriani for linguistic purpose. Keywords: Indonesian Stemmer, Enhanced Confix Stripping, Nazief & Adriani.
Sumber
Judul Serupa
- Analisis Perbandingan Algoritma Idris Dan Algoritma Enhanced Confix Stripping (ECS) Stemmer Pada Dokumen Teks Bahasa Indonesia
- PERBANDINGAN ALGORITMA STEMMING NAZIEF & ADRIANI, PORTER DAN ARIFIN SETIONO UNTUK DOKUMEN TEKS BAHASA INDONESIA