Logo Eventkampus
Perpustakaan judul masih dalam tahap pengembangan, admin siap menampung kritik dan saran
Pengaruh DBSCAN Dan DIM Terhadap Tingkat Akurasi Pengelompokkan Artikel Berbahasa Inggris Dengan Metode K-Means
Khairul Rijal (2017) | Skripsi | Teknik Informatika , Teknik Komputer
Bagikan
Ringkasan
Data dalam bentuk teks pada artikel berbahasa Inggris semakin meningkat. Hal ini menyebabkan sulitnya untuk mendapat informasi sesuai dengan keinginan pengguna dari data tersebut. Untuk ini, perlu adanya solusi yang dapat digunakan untuk mengelompokkan data. Salah satu solusinya adalah dengan clustering dengan algoritma K-means. Namun algoritma tersebut memiliki kelemahan yaitu tidak dapat mendeteksi noise pada data dan inisialisasi pusat cluster yang tidak stabil. Hal ini menyebabkan akurasi pengelompokan data tidak optimal. Penelitian ini bertujuan menggunakan DBSCAN dan DIM untuk meningkatkan akurasi pengelompokan artikel berbahasa Inggris dengan algoritma K-means. Penelitian ini merupakan jenis penelitian eksperimen untuk mengidentifikasi akurasi hasil clustering artikel dengan melihat nilai precission dari hasil tersebut. Sampel yang digunakan adalah 100 artikel Ilmiah berbahasa Inggris yang dikelompokkan kedalam 5 kelompok. Hasil ekperimen menujukkan bahwa metode DBSCAN dan DIM memiliki pengaruh dalam meningkatkan akurasi pengelompokan artikel, masing-masing sebesar 23,33% dan 41,41% dan sisanya menunjukkan kelompok data yang tidak akurat pada masing-masing metode. Jika metode DBSCAN dan DIM digabungkan maka akurasi pengelompokan artikel menjadi sebesar 26,97% dan sisanya tidak akurat. Kendala yang muncul pada penelitian ini adalah sulit untuk menentukan parameter pada setiap metode secara tepat. Secara umum hipotesis dari penelitian ini sudah terbukti, yaitu DBSCAN dan DIM dapat meningkatkan akurasi pengelompokan artikel. Namun berdasarkan hasil penelitian tersebut, peneliti menyarankan agar dicari terlebih dahulu metode untuk menentukan parameter dan memperhatikan elemen dari artikel yang digunakan. Kata Kunci: Pengelompokan Teks, K-Means, DBSCAN, DIM.
Ringkasan Alternatif
Data text in English articles are abundant. This causes difficulty for users to obtain information they need. Therefore it is needed to find a solution that can be used to classify the data. One of solutions to solve the problems is by clustering the data using K-means algorithm. However, the algorithm has disadvantages, that is it could not detect the noise in the data and could not stabilize the initialization of cluster centers. This can cause the accuracy of data clustering becoming not optimal. The aim of this research is to use DBSCAN and DIM method to improve the clustering accuracy of English articles by using K-means algorithm. This study was an experimental research for identifying the accuracy of articles clustering by looking at the value of precision from the clustering result. The researcher used 100 English scientific articles for samples, which are classify into 5 groups. The result of experiments showed that DBSCAN and DIM methods have influences to increase the clustering accuracy of English articles with the results of each methods are 23,33% and 41,41% and the rest if them were inaccurate. When, DBSCAN and DIM are combined, the clustering accuracy of English articles has value of 26,97% and the rest of them were inaccurate. The obstacle encountered in this study was the difficulty of determining the parameters for each method accurately. However, In general, the hypothesis of this study had proven, that DBSCAN and DIM could improve the clustering accuracy of English articles. Based on the result of the study, the researcher suggests that the method to determine the parameters should be found first and the element of the articles used as test data should be observed accurately. Keywords: Text Clustering, K-Means, DBSCAN, DIM.
Sumber