Perpustakaan judul masih dalam tahap pengembangan, admin siap menampung kritik dan saran
Analisis performasi algoritma winnowing dan algoritma manber untuk deteksi kesamaan dokumen teks berbahasa Indonesia
Bambang Imam Hermawan NIM. (2015) | Skripsi | Teknik Informatika
Bagikan
Ringkasan
Pendeteksian kemiripan dokumen teks dapat dilakukan menggunakan metode fingerprinting dokumen. Dua algoritma yang termasuk dalam metode fingerprinting dokumen yaitu algoritma winnowing dan algoritma manber. Permasalahan yang membedakan kedua algoritma adalah perbedaan saat pemilihan nilai hashing dari perhitungan nilai hash. Nilai persentasi kemiripan kedua algoritma dipengaruhi nilai input pengguna sehingga mempengaruhi kecepatan, ketepatan dan jumlah langkah dari kedua algoritma dalam memproses dokumen teks. Tahapan analisis juga dilakukan dengan pertimbangan pengaruh bahasa pada kedua algoritma. Analisis dari kedua algoritma dilakukan dengan parameter yang menguji kecepatan waktu, ketepatan, serta jumlah langkah yang dimiliki oleh kedua algoritma dalam proses membandingkan kesamaan dari dua buah dokumen. Pengujian dilakukan dengan uji jumlah perbedaan gram, window, ukuran p, basis prima terhadap persentasi perhitungan dari dua buah dokumen. Berdasarkan hasil pengujian dapat disimpulkn bahwa metode Manber lebih cepat dari Winnowing namun dalam hal ketepatan Winnowing lebih baik dari Manber. Hasil analisis dari jumlah langkah dari kedua metode menunjukan perbedaan jumlah langkah dari keduanya yang menunjukan Winnowing memiliki jumlah langkah lebih banyak dari Manber. Parameter input pengguna juga mempengaruhi persentasi kemiripan karena parameter input digunakan dalam perhitungan nilai hashing yang dilakukan oleh sistem. Kelebihan dan kekurangan dari kedua metode tersebut menjadikan keduanya dapat unggul menurut kriteria kebutuhan yang ingin dicapai sebuah sistem.
Ringkasan Alternatif
Text document similarity detection can be performed using the document fingerprinting method. Two algorithms are included in the document fingerprinting method is Winnowing algorithm and Manber algorithm. Problems that distinguishes the two algorithms is the difference when selecting the hashing value of the hash value calculation. The value percentage similarity of the two algorithms is affected value of the user input that affect the speed, accuracy and the number of steps of the algorithm in processing text documents. stages of analysis is also carried out with consideration of the influence of language on both algorithms. Analysis of the two algorithms is done by testing the parameters of time speed, accuracy, and the number of steps that are owned by the two algorithms in the process of comparing the similarity of two documents. Test conducted by test number difference grams, window, the number p, a prime base for calculating the percentage of the two documents. Based on the test results it can be concluded that the method Manber is faster than Winnowing, but for accuracy Winnowing is better than Manber algorithm. The results of the analysis of the number of steps of the algorithm shows the difference in the number of steps of the algorithm that shows Winnowing has a number of steps more than Manber. User input parameters also affect the percentage of similarity because the input parameters used in the calculation of the value of hashing by the system. The advantages and disadvantages of both methods can make both superior according to the criteria that needs to be achieved a system.