Logo Eventkampus
Perpustakaan judul masih dalam tahap pengembangan, admin siap menampung kritik dan saran
Analisis Kinerja Waktu Query Processing pada Aplikasi Search Engine Menggunakan HBase
Ine Siti Nur'aini (2017) | Skripsi | Teknik Informatika , Teknik Komputer
Bagikan
Ringkasan
Search engine merupakan salah satu aplikasi yang digunakan untuk mencari informasi dari sekumpulan dokumen yang sangat banyak. Secara alamiah, search engine menggunakan prinsip full-text search yaitu melakukan pencarian berbasis kata-kata dalam suatu dokumen, dan biasanya menggunakan database yang berorientasi dokumen. Namun, pada penelitian ini akan menggunakan database berorientasi kolom yaitu HBase yang tidak memiliki kemampuan untuk melakukan full-text search. Oleh karena itu, dibutuhkan suatu mekanisme tambahan untuk melakukan pemrosesan selanjutnya agar HBase dapat melakukan full-text search. Salah satu cara untuk menerapkan full-text search secara umum adalah dengan penerapan inverted index. Penerapan inverted index pada HBase dapat dilakukan dengan cara mebuat suatu tabel yang berisi pemetaan term beserta frekuensi dan bobot yang ada dalam suatu dokumen. Selain itu, secara umum sistem database biasanya memiliki fasilitas yang mendukung pencarian yang berupa indexing seperti primary index dan secondary index. Sedangkan HBase tidak memiliki kemampuan secondary index. Penelitian terkait sebelumnya telah menerapkan inverted index pada HBase, namun model data yang diterapkan tidak mencapai kemampuan full-text search. Agar execution time query processing efisien, model data tersebut memerlukan adanya secondary index sehingga mencapai full-text search. Penelitian ini telah memperbaiki model data dari penelitian sebelumnya sedemikian sehingga kemampuan full-text search tercapai. Model data yang dibuat pada penelitian ini, menggunakan nested entity dan mengimplementasi primary key langsung pada term. Secara teoritis dan eksperimen terbukti bahwa execution time model data baru hasil perbaikan lebih cepat dibandingkan dengan model data pada penelitian sebelumnya. Kata kunci: search engine, HBase, full-text search, inverted index, execution time, query processing.
Ringkasan Alternatif
Search engine is one of the applications that is to search for information on the collection of data. Naturally, search engines use full-text search principles that searches based on words in a document, and usually use a document-oriented database. However, this research will use column-oriented database HBase which do not have the ability to perform full-text search. Therefore, it requires an additional mechanism, so that the HBase can perform full-text search. So, that the user can search by keyword to HBase tables besides rowkey. One way to implement full-text search is by applying inverterd index in general. Implementing inverted index on HBase can be done by constructing a table that contains the mapping terms along with documents in term of frequency and its inverse document frequency. In addition, while general database systems usually support indexing in the form of primary index and secondary index, HBase does not support secondary index features. Previous related research have applied inverted index on HBase, however its data model does not lead to full-text search capability. To achieve execution time query processing efficiency, the data model requires the existence of a secondary index, so that full-text search can be achieved. This research has improved the data model of previous research, so that the full-text search capability of HBase is achieved. The data model created in this research used nested entities and implement primary key on the term directly. It is proved theoretically and experimentally that the execution time of new data model is faster than previous research. Keywords: search engine, HBase, full-text search, inverted index, execution time query processing.
Sumber