Perpustakaan judul masih dalam tahap pengembangan, admin siap menampung kritik dan saran
Perbandingan Penerapan Metode Needleman Dan Levenshtein Pada Pos Plag-Inn Dalam Mendeteksi Plagiarisme Intrinsik
Rinaldy Ardyansyah Rukman (2018) | Skripsi | Teknik Informatika , Teknik Komputer
Bagikan
Ringkasan
Revolusi digital sedang terjadi dan berubah dengan cepat. Revolusi digital memiliki dampak buruk diantaranya adalah mudahnya tindak plagiarisme. Mendeteksi plagiarisme secara intrinsik dengan mencari bagian dokumen yang bukan ditulis oleh penulisnya. Terdapat penelitian yang mendeteksi plagiarisme secara intrinsik berdasarkan gaya tulis dengan memanfaatkan aturan part-of-speech (pos) tagging dan metode needleman. Algoritma plag-inn dimanfaatkan dalam membandingkan gaya tulis pada setiap kalimat untuk mendeteksi plagiarisme. Penelitian lain menyatakan metode levenshtein memiliki akurasi lebih baik dibandingkan dengan needleman dalam mendeteksi kemiripan deoxyribonucleic acid (DNA). Pos tag dan DNA serupa karena informasi terletak pada elemen dan urutan elemen tersebut. Oleh karena itu, levenshtein dapat diterapkan menggantikan needleman. Penelitian penulis mendeteksi plagiarisme menggunakan algoritma plag-inn dengan membandingkan penerapan metode needleman dan levenshtein. Tahapan mendeteksi plagiarisme sesuai algoritma plag-inn yang pertama adalah membuka dokumen uji. Tahap kedua adalah memecah dokumen kedalam kalimat dan menganotasikan kalimat tersebut kedalam pos tag. Tahap ketiga adalah membandingkan pos tag setiap kalimat dengan metode needleman dan levenshtein. Keempat adalah merata - ratakan hasil perbandingan setiap kalimat. Setelah itu, dilakukan proses thresholding untuk menentukan kalimat plagiarisme. Proses thresholding pada penelitian ini menggunakan metode k-mean clustering. Tahap terakhir adalah melakukan evaluasi hasil pendeteksian untuk setiap metode. Eksperimen dilakukan dengan menguji dokumen dari PAN-PC-2010 dan OpenThesis menggunakan aplikasi yang dikembangkan. Hasil eksperimen adalah rata - rata akurasi untuk kedua metode. Hasil metode needleman adalah 0,2792 dan metode levenshtein adalah 0,3076. Haisl perbandingan menunjukkan metode levenshtein lebih baik untuk digunakan dalam mendeteksi plagiarisme intrinsik. Kata Kunci: pendeteksian plagiarisme intrinsik, gaya penulisan, part-of-speech tag, needleman, levenshtein.
Ringkasan Alternatif
The digital revolution is happening and changing rapidly. The digital revolution has a disastrous effect, such as the ease of plagiarism. Detecting plagiarism intrinsically by searching for part of documents that are not written by the author. There is a study in detecting plagiarism intrinsically based on writing style by utilizing the part-of-speech (pos) tagging rule and the needleman method. The plag-inn algorithm is used in comparing the writing style of each sentence to detect plagiarism. Another study said the levenshtein method has better accuracy than the needleman in detecting the deoxyribonucleic acid (DNA) similarity. POS tag and DNA are similar because the information lies in the elements and the order of those elements. Therefore, levenshtein can be applied to replace needleman. This research detects plagiarism using a plag-inn algorithm by comparing the application of needleman and levenshtein methods. The first step of detecting plagiarism according to the plag-inn algorithm is to open the test document. The second step is breaking the document into sentences and annotate the sentence into the pos tag. The third step is comparing each sentence's post tag with the needleman and levenshtein methods. Fourth is averaging the comparison results of each sentence. After that, thresholding process is used to determine plagiarized sentences. The thresholding process in this research uses k-mean clustering method. The last step is evaluating the results of detection for each method. Experiments were done by examining documents from PAN-PC-2010 and OpenThesis using the developed applications. The experiment results are the average accuracy of both method. The result of needleman method is 0.2792 and the levenshtein method is 0.3076. Comparison result shoh the levenshtein method is better for use in detecting intrinsic plagiarism. Keywords: intrinsic plagiarism detection, writing style, part-of-speech tags, needleman, levenshtein.