Perpustakaan judul masih dalam tahap pengembangan, admin siap menampung kritik dan saran
Meningkatkan Hasil Cluster Pada Algoritma Weighted Dissimilarity Measure K-Modes Menggunakan Evidence Accumulation K-Modes
Sri Anggraini Surianto NIM. (2017) | Tesis | Sistem Informasi
Bagikan
Ringkasan
Clustering merupakan salah satu teknik yang digunakan dalam data mining untuk mengelompokkan suatu objek. Data yang digunakan dalam clustering dapat berupa data numerik dan kategori. Saat ini pada kategori data merupakan topik yang sedang banyak dilakukan dalam penelitian. Algoritma KModes digunakan untuk mengatasi masalah pada data bersifat kategori yang tidak dapat dihitung menggunakan konsep geometri. Namun terdapat beberapa kekurangan yang dimiliki K-Modes yaitu penentuan titik pusat awal dan pengukuran jarak cluster. Terdapat beberapa algoritma yang berusaha memperbaiki kelemahan algoritma K-Modes, diantaranya adalah algoritma Weighted Dissimilarity Measure K-Modes untuk mencari jarak cluster terbaik. Selain itu ada juga algoritma yang berusaha memperbaiki kekurangan algoritma Evidence Accumulation K-Modes yang mampu menentukan pusat cluster awal. Kedua algoritma memiliki keunggulan dan kelemahan berbeda, sehingga penelitian ini menggabungkan algoritma Weighted Dissimilarity Measure K-Modes dan Evidence Accumulation K-Modes (WDM-EA K-Modes) untuk dapat mencari jarak cluster terbaik sekaligus menentukan pusat cluster awal. Algoritma ini diimplementasikan pada dataset untuk mengetahui karakteristik algoritma. Penelitian ini terlihat bahwa algoritma WDM-EA K-Modes memiliki kinerja yang lebih unggul dari algoritma K-Modes dan WDM K-Modes. Pada dataset yang memiliki jumlah atribut 4-21 untuk jumlah data berjumlah 47-1728 berdasarkan evaluasi Purity Measure. Hal ini terbukti saat diimplementasikan pada dataset, algoritma WDM-EA K-modes menghasilkan hasil clustering dengan nilai Purity terbaik.
Ringkasan Alternatif
Clustering is one of techniques used in data mining to group an object. The data used in clustering are numeric and category. Currently, categories are topics that are conducted in research. The K-Modes algorithm is used to solve problems in the category data which canÃât be calculated by the geometry concept. However, there are the drawbacks of K-Modes algorithm that is for finding initial centroid and for measure the best distance of cluster. There are several algorithms which made by researchers for improving KModes algorithm. One of them is Weighted Dissimilarity Measure K-Modes algorithm for measure the best distance of cluster. Another algorithm is Evidence Accumulation K-Modes, the method for finding initial centroid, so author proposed to combine Weighted Dissimilarity Measure K-Modes and Evidence Accumulation K-Modes (WDM-EA K-Modes) algorithm to determine both the best distance of cluster and initial centroid for improving quality of clustering result. This algorithm is implemented on dataset to find out the algorithm's characteristics. This research, it can be seen that based on Purity Measure, WDM-EA KModes algorithm has better performance than K-Modes and WDM K-Modes algorithm. On dataset with the number of attributes 4-21 and has data 47-1728. In case of clustering for dataset, WDM-EA K-modes algorithm also produce clustering result which has the best Purity.