Perpustakaan judul masih dalam tahap pengembangan, admin siap menampung kritik dan saran
Analisis dan Implementasi Neo4j (NoSQL Graph Database) pada Mesin Pencari Web Semantik
Faris Arifiansyah (2018) | Skripsi | Teknik Informatika , Teknik Komputer
Bagikan
Ringkasan
Perkembangan teknologi web 2.0 ke web 3.0 (web semantik) berdampak pada dibutuhkannya search engine untuk web semantik. Saat ini telah ada search engine web semantik yang dapat memproses query multi term dengan pendekatan shortest path menggunakan storage engine virtuoso. Namun, pemrosesan multi term dengan engine tersebut lambat. Oleh karena itu, diperlukan storage engine yang dapat memproses query dengan cepat. Berdasarkan hasil perbandingan dengan virtuoso, neo4j dipilih sebagai storage engine pada search engine web semantik yang dibangun. Neo4j menyimpan data dengan model property graph, sedangkan web semantik menggunakan model data resource description framework (RDF) dan web ontology language (OWL). Hal ini menyebabkan perlu adanya proses transformasi data dari model web semantik ke property graph. Pada penelitian ini, proses transformasi RDF dan OWL dipermudah dengan library Jena RDF API dan OWL API. Penelitian ini mengembangkan algoritma transformasi RDF dan OWL ke property graph. Selain proses transformasi, bagian utama lainnya dari penelitian ini adalah search engine web semantik. Terdapat dua hal yang menjadi fokus kajian, yaitu kecepatan pemrosesan query dan ketepatan search engine tersebut. Untuk mengetahui kedua hal itu, pada penelitian ini dilakukan eksperimen. Data yang digunakan untuk eksperimen kecepatan pemrosesan query adalah ontologi DBpedia yang berisi 62 juta triples, sedangkan data untuk eksperimen presisi adalah ontologi movie yang disusun dengan tingkat ekspresivitas SROIQ(D). Eksperimen kecepatan pemrosesan query dilakukan dengan mengendalikan jumlah data dan jumlah term, sedangkan eksperimen presisi dilakukan dengan melihat output yang dihasilkan berdasarkan query dan keadaan data di dalam database. Hasil dari penelitian ini menunjukkan bahwa transformasi OWL ke property graph sudah terbukti benar untuk tingkat ekspresivitas SROIQ(D). Selain itu, hasil eksperimen menunjukkan bahwa presisi search engine yang dibangun mencapai 93%. Waktu pemrosesan query paling lama adalah 4,6 detik untuk query kurang dari 5 term dengan jumlah data 60 juta triples. Berdasarkan hasil tersebut, disimpulkan bahwa neo4 layak digunakan sebagai storage engine web semantik. Kata Kunci: neo4j, RDF, OWL, search engine web semantik, search engine precision, shortest path.
Ringkasan Alternatif
The advancement of web 2.0 to web 3.0 (semantic web) has an impact that semantic web search engine is needed. Currently, there is a semantic web search engine that can process multi term queries with shortest path approach using virtuoso as the storage engine. However, multi-term processing with that engine was slow. Therefore, a storage engine that can process queries faster is needed. After compared with virtuoso, neo4j is selected as the storage engine for semantic web search engine to be developed. Neo4j stores data with property graph models, whereas semantic web uses resource description framework (RDF) and web ontology language (OWL) as data models. This leads to the need for data transformation process from semantic web models to a property graph. In this study, the transformation process of RDF and OWL is facilitated by Jena RDF API and OWL API. This research developed the transformation algorithm from RDF and OWL to property graph. In addition to the transformation process, another major part of this research is the semantic web search engine. There are two things that become focus of this study, namely the speed of query processing and the search engine precision. To know these two things, experiments are conducted. The data used for query processing speed experiment is an ontology obtained from DBpedia (total of 62 million triples), while data for precision experiment is movie ontology with SROIQ(D) expressivity. The experiment of query processing speed is done by controlling the amount of data and the number of terms, while the precision experiment is done by looking at the output generated based on the query and the state of the data in the database. The results of this study indicate that the transformation of OWL into property graph has been proven true for SROIQ(D) expressivity. In addition, the experimental results show that the precision of this search engine is 93%. The longest query processing time is 4.6 seconds for queries less than 5 terms with the amount of the data are about 60 million triples. Based on these results, it is concluded that neo4j is suitable for semantic web storage engine. Keywords: neo4j, RDF, OWL, semantic web search engine, search engine precision, shortest path.