Perpustakaan judul masih dalam tahap pengembangan, admin siap menampung kritik dan saran
Analisis Penggunaan Metode Weighted PageRank Dengan Latent Semantic Analysis Pada Sistem Temu Balik Informasi
Hakim Marsudi (2017) | Skripsi | Teknik Informatika , Teknik Komputer
Bagikan
Ringkasan
Sistem temu balik informasi adalah sistem yang dapat memberikan hasil pencarian kepada pengguna berdasarkan kata kunci yang dimasukkannya. Kekurangan yang paling mendasar pada metode pencarian saat ini adalah kata kunci yang digunakan dalam pencarian seringkali menghasilkan hanya informasi yang mengandung sintaks yang sama dengan kata kunci, sehingga kadang tidak sesuai dengan informasi yang mereka cari. Masalah yang dibahas dalam penelitian ini yaitu pengembangan sistem temu balik informasi yang menghasilkan pencarian yang relevan tetapi tidak hanya berdasarkan sintaks tetapi juga semantic dan berdasarkan popularitas. Untuk pengambilan informasi, hasil dari pencarian informasi berupa daftar halaman web yang sudah difilter berdasarkan term query yang diinputkan. Perangkat lunak ini melakukan pembacaan terhadap halaman web dengan menggunakan HTML DOM yang kemudian menjadi beberapa string dari halaman web tersebut dan dilakukan proses tokenizing dan filtering yang menghasilkan token-token yang terpilih dan dilanjutkan dengan stemming dimana mekanismenya diambil dari salah satu algoritma stemming kata yaitu algoritma Porter. Pada saat proses ekstraksi akan didapatkan juga outlink dan inlink dari anchor tag dari suatu halaman web sebagai nilai awal untuk pembobotan menggunakan Weighted PageRank (WPR). Setelah itu dihitung bobot term menggunakan Term Frequency-Inverse Document Frequency (TF-IDF) dan dihitung tingkat kemiripan (similaritas) menggunakan metode Latent Semantic Analysis (LSA). Hasil dari penelitian ini menunjukan bahwa penggabungan metode Latent Semantic Analysis (LSA) dengan Weighted PageRank (WPR) dalam sistem temu balik informasi dapat meningkatkan relevansi data yang dihasilkan sebesar 15%, dibandingkan dengan sistem temu balik informasi yang hanya menggunakan metode Weighted PageRank (WPR). Kata Kunci: TF-IDF, LSA, SVD, WPR, sistem temu balik informasi, similarity, filtering, outlink, inlink.
Ringkasan Alternatif
Information retrieval system is a system that can provide search results based on user's keyword. The most fundamental deficiency of current retrieval method is that it only retrieves information that contains the same syntax as the keywords. Therefore, the retrieved information sometimes does not corresponds to what users really want to know. The problem dealt in this research is the development of information retrieval system that produces relevant search results but not only based on keyword input, but also semantic and popularity. The result of information retrieval is a list of web pages that has been filtered by query term. The software performs reading of web pages using HTML DOM which then become group of string made of the web page's content. Then, the software performs tokenizing and filtering that produce tokens. Selected tokens are then stemmed using one of stemming algorithm called Porter algorithm. Outlink and inlink are both used as the initial value of Weighted PageRank (WPR) and are both obtained during extraction process, taken from anchor tag of a web page. Finally, the weight of a term is calculated using Term Frequency-Inverse Document Frequency (TF-IDF), while the degree of similarity is calculated using Latent Semantic Analysis (LSA). The result of this research shows that incorporating Latent Semantic Analysis (LSA) and Weighted PageRank (WPR) in information retrieval system increases data releveance by 15%, as opposed to information retrieval system that only uses Weighted PageRank (WPR) method. Keywords: TF-IDF, LSA, SVD, WPR, information retrieval, similarity, filtering, outlink, inlink.