Perpustakaan judul masih dalam tahap pengembangan, admin siap menampung kritik dan saran
Peningkatan Kualitas Hasil Clustering Menggunakan Algoritma Hierarchical Agglomerative Clustering Kmeans-Particle Swarm Optimization (Studi Kasus: Segmentasi Pasar Film)
Chrismikha Hardyanto NIM. (2017) | Tesis | Sistem Informasi
Bagikan
Ringkasan
IMDB merupakan sebuah website yang menyediakan berbagai data mengenai film. Untuk mengetahui informasi segmentasi pasar film saat ini, dapat dilakukan dengan cara mengelompokkan data film pada IMDB. Sebuah metode yang dapat membantu untuk menyelesaikan masalah pengelompokan adalah clustering. Clustering dapat mengelompokkan data berdasarkan kemiripan antar atribut data, sehingga dapat dihasilkan kelompok segmentasi pasar film yang tepat. Terdapat dua teknik pada clustering yang dapat digunakan untuk menyelesaikan kasus segmentasi pasar film yaitu clustering berbasis hierarki dan clustering berbasis partisi. Algoritma hierarki Seperti Hierarchical Agglomerative Clustering (HAC) dapat menduga jumlah cluster terbaik dari suatu dataset. Akan tetapi, penambahan jumlah data dan atribut dapat menyebabkan akurasi hasil clustering dari algoritma hierarki menjadi buruk. Di sisi lain, clustering berbasis partisi memiliki akurasi yang baik dalam pengelompokkan data. Akan tetapi teknik ini memiliki kekurangan yang terletak pada pemilihan centroid awal pada dataset yang dilakukan secara acak. Untuk memperbaiki masalah tersebut, terdapat algoritma K-PSO yang dapat mencari centroid awal terbaik. Akan tetapi K-PSO tidak dapat menduga jumlah cluster terbaik yang dapat terbentuk dari suatu dataset. Penelitian ini mencoba untuk menggabungkan keunggulan dari algoritma HAC dan K-PSO untuk meningkatkan kualitas hasil clustering pada kasus segmentasi pasar film. Bedasarkan hasil evaluasi menggunakan metode Davies-Bouldin Index (DBI), terlihat bahwa Algoritma HA-KPSO memiliki kinerja paling baik pada dataset yang memiliki jumlah atribut lebih dari 10 dengan jumlah data kurang dari 100 data dan lebih dari 500 data. Hal ini terbukti saat diimplementasikan pada dataset IMDB untuk kasus segmentasi pasar film, algoritma HA-KPSO dapat menghasilkan hasil clustering dengan nilai DBI lebih baik dibandingkan algoritma K-PSO dan DE-KMeans.
Ringkasan Alternatif
IMDB is a website that provide various data about movie. To find an information about current movie market segmentation, it can be done by grouping movie data on IMDB. A method that can help for grouping movie data is clustering. Clustering is a technique for grouping data based on similarity between data so it can produce an appropriate clusters which represent data characteristics. There are two clustering techniques that can be used to solve movie market segmentation problem, those are hierarchical based clustering and partition based clustering. A Hierarchical algorithm like Hierarchical Agglomerative Clustering can be utilized to estimate the number of clusters in a dataset. However, if the amount of data become larger, it's will make the cluster quality worse. On the other hand, partition based clustering has a better accuracy for grouping large dataset. However, this technique has a weakness due to initial centroid was chosen randomly from a dataset. To solve centroid selection problem, there is a K-PSO algorithm which able to find the best initial centroid from a dataset. However, KPSO cannot predict the number of cluster that can be generated from a dataset. This research try to combine the advantages of HAC and K-PSO algorithms to improve the quality of clustering result for movie market segmentation. Based on evaluation using Davies-Bouldin Index (DBI), It appears that HAKPSO algorithm can performs better on a dataset that has more than 10 attributes with the numbers of data less than 100 data and more than 500 data. This is proven when HA-KPSO algorithm is implemented on IMDB dataset for movie market segmentation problem by generating clusters with better DBI values than K-PSO and DE-KMeans algorithm.