Logo Eventkampus
Perpustakaan judul masih dalam tahap pengembangan, admin siap menampung kritik dan saran
Perbandingan Beberapa Metode Similarity Measurement Pada Item Based Collaborative Filtering dengan Multi Kriteria
Muhammad Husain Fadhlullah (2019) | Skripsi | Teknik Informatika , Teknik Komputer
Bagikan
Ringkasan
Masalah informasi yang berlebih (information overload) terjadi karena meningkatnya pertumbuhan informasi terutama pada dunia internet, yang menyulitkan pengguna internet untuk mencari informasi relevan sesuai dengan kebutuhan mereka. Masalah tersebut dapat diselesaikan dengan sistem rekomendasi. Pada sistem rekomendasi terdapat proses prediksi yang memiliki peran penting dalam membantu memberikan saran kepada pengguna suatu informasi yang relevan dengan pengguna tersebut. Salah satu metodenya yaitu collaborative filtering (CF). CF salah satu teknik yang paling umum yang digunakan dengan cara menggali informasi pengguna di masa lalu dan opini orang lain yang mempunyai kemiripan dengan pengguna tersebut, kemudian informasi tersebut digunakan untuk memprediksi suatu item baik berupa informasi, barang, atau layanan yang kemungkinan akan disukai oleh pengguna. Pendekatan CF yang digunakan dalam penelitian ini adalah item-based collaborative filtering (IBCF). Pada proses CF terdapat suatu tahap perhitungan kemiripan (similarity measurement) yang dapat mempengaruhi hasil dari prediksi kepada pengguna. Dalam melakukan perhitungan kemiripan dibutuhkan data berupa opini eksplisit yaitu data rating. Data rating yang digunakan dalam penelitian ini multi kriteria yaitu rating terhadap hotel dari aspek kebersihan, harga, pelayanan, kualitas tidur, lokasi, dan ruangan yang diberikan oleh pengguna. Penelitian ini membandingkan metode-metode similarity measurement yaitu cosine similarity, tanimoto coefficient, pearson correlation dan euclidean distance pada IBCF dengan data rating multi kriteria untuk mendapatkan metode yang memiliki akurasi prediksi terbaik. Alat ukur prediksi menggunakan metode mean absolute error (MAE). Semakin kecil nilai MAE semakin akurat hasil prediksinya. Didapatkan hasil bahwa metode similarity measurement yang memiliki nilai akurasi paling baik untuk semua metode yaitu cosine similarity. Kata kunci: information overload, similarity measurement, item-based collaborative filtering, mean absolute error, dan data rating multi kriteria.
Ringkasan Alternatif
Information overload occurs because of the increasing growth of information, especially in the internet world, which makes it difficult for internet users to find relevant information according to their needs. This problem can be solved using recommendation system. In the recommendation system there is a prediction process that has an important role to provide relevant advice to user. One method is collaborative filtering (CF). CF is one of the most common techniques used by digging up user information in the past and the opinions of others who have similarities with the user, then the information is used to predict an item in the form of information, goods, or services that the user might like. The CF approach used in this study is item-based collaborative filtering (IBCF). In the CF process there is a similarity measurement that can affect the results of predictions to users. In calculating the similarity, the data needed in this case is an explicit opinion, namely the rating data. Rating data used in this study are multi criteria, namely ratings on hotels from aspects of cleanliness, price, service, quality of sleep, location, and room given by users. This study compares similarity measurement methods namely cosine similarity, tanimoto coefficient, pearson correlation and euclidean distance on IBCF with multi criteria rating data to get method that has the best prediction accuracy. Mean absolute error (MAE) method that used to measure the smallest mean error. The smaller the MAE value the more accurate the prediction results. The results showed that the similarity measurement method which has the best accuracy value for all methods, namely cosine similarity. Keywords: information overload, similarity measurement, item-based collaborative filtering, mean absolute error, and multi criteria rating data.
Sumber