Logo Eventkampus
Perpustakaan judul masih dalam tahap pengembangan, admin siap menampung kritik dan saran
Implementasi Algoritma Lesk Untuk Synonim Recognition Dan Rabin Karp Pada Pendeteksian Plagiarisme
Moch Nurhalimi Z.D NIM. (2016) | Skripsi | Teknik Informatika
Bagikan
Ringkasan
Penjiplakan dokumen digital bukanlah hal yang susah, cukup dengan menggunakan teknik copy-paste-modify pada sebagian isi dokumen dan bahkan keseluruhan isi dokumen sudah bisa dikatakan bahwa dokumen tersebut merupakan hasil duplikasi dari dokumen lain. Salah satu metoda yang digunakan untuk mendeteksi plagiarisme adalah string macthing. Salah satu algoritma string matching yang sering digunakan adalah rabin karp menurut salah satu jurnal algoritma rabin karp menghasilkan efesiensi waktu yang lebih baik dalam mendeteksi string yang memiliki pola banyak. Terkadang plagiarisme juga dilakukan dengan mengganti kata-kata yang mengandung kata - kata sinonim, dengan maksud agar terlihat berbeda dari dokumen aslinya. Sehingga setelah proses preprocessing dilakukan proses pengenalan sinonim dan pemilihan kata sinonim (synonim recognition). Pada tahap proses preprocessing dilakukan proses pemecahan kalimat , pemilihan kalimat, casefolding, tokenizing, stemming, stopword removal, kemudian setelah tahap preprocessing dilakukan proses synonim recognition dengan algoritma lesk untuk memilih kata sinonim , parsing k-gram , hashing dan pencocokan string dengan rabin karp.Dapat disimpulkan bahwa kombinasi algoritma lesk untuk proses synonym recognition dan rabin rabin karp dalam penerapan pada kasus plagiarism (kesamaan) menghasilkan presentase kesamaan rata – rata yaitu sebesar 85,78%, dibandingkan yang tidak menggunakan proses synonim recognition yaitu menghasilkan rata – rata sebesar 77.45%, meskipun membutuhkan waktu proses yang lebih banyak daripada tidak menggunakan synonym recognition.
Ringkasan Alternatif
Plagiarism digital document is not difficult , enough with used technique copy-paste-modify during the document and even a whole document has to be said that they are is the result of duplication of other documents .One method used to detect plagiarism is a string of macthing .One algorithms string matching often used is rabin karp according to one journal algorithms rabin karp produce efesiensi a great time in detecting string having a pattern of many .Sometimes plagiarism also carried out by replacing kata-kata that included the word - synonymous words , and in order that appear different from the original documents .So after the preprocessing done process of the introduction of a synonym and selection of synonymous words ( synonim recognition ). At the process of preprocessing done process of resolving the sentence , an election sentence , casefolding , tokenizing , stemming , stopword removal , then the preprocessing done process synonim recognition by algorithms lesk to choose synonymous words , parsing k-gram , hashing and matching string by rabin karp. We can conclude that a combination of algorithmic lesk synonym for the recognition and rabin rabin karp in their in the case of plagiarism ( similarity ) produce the percentage of the average a month 85,78 %, than not using a process synonim recognition to create the average of 77.45 %, although took the process more than not using synonym recognition..
Sumber