Logo Eventkampus
Perpustakaan judul masih dalam tahap pengembangan, admin siap menampung kritik dan saran
Analisis Penggunaan Metode Latent Dirichlet Allocation (LDA) Menggunakan Pendekatan Collapsed Gibbs Sampling Untuk Pemodelan Topik Abstrak Dokumen Laporan Tugas Akhir
Yuda Rahman (2018) | Skripsi | Teknik Informatika , Teknik Komputer
Bagikan
Ringkasan
Mahasiswa Tingkat Akhir Jurusan Teknik Komputer setiap tahunnya mengerjakan tugas akhir. Tugas akhir tersebut merupakan salah satu syarat kelulusan. Untuk mengerjakan tugas akhir dibutuhkan referensi-referensi, salah satunya adalah dokumen tugas akhir tahun-tahun sebelumnya. Untuk mencari dokumen tugas akhir tersebut Jurusan Teknik Komputer hanya memperlihatkan katalog yang berisi judul-judul Tugas Akhir. Permasalahannya adalah tidak semua judul yang diberikan menggambarkan isi dari dokumen tersebut. Sehingga dibutuhkan cara untuk menemukan referensi yang tepat. Salah satu cara dalam mengatasi masalah tersebut adalah dengan pemodelan topik. Pada penelitian sebelumnya telah dilakukan penelitian pemodelan topik dengan metode Robust Probabilistic Latent Semantic Analysis (RPLSA) yang merupakan perluasan Probabilistic Latent Semantic Analysis (PLSA) dengan penanganan overfitting pada tugas akhir lalu. Dari referensi penelitian pada bidang pemodelan topik didapatkan kesimpulan bahwa perluasan PLSA dapat dilakukan juga dari pendekatan lain yang disebut Latent Dirichlet Allocation (LDA). Namun LDA membutuhkan metode untuk estimasi topik karena tidak bisa diimplementasikan. Terdapat metode untuk estimasi topik yaitu dengan menggunakan pendekatan Collapsed Gibbs Sampling. Untuk mengetahui seberapa bagus metode tersebut diukur relevansi dengan membandingkan pengelompokan dokumen menggunakan Collapsed Gibbs Sampling dan pengelompokan dokumen menggunakan judgement dari ahli yaitu pembimbing/penguji dari dokumen laporan tugas akhir yang mengetahui topik dari dokumen tersebut. Dari penelitian yang sudah dilakukan didapatkan hasil relevansi dari metode Collapsed Gibbs Sampling sebesar 52.5% jika dibandingkan dengan judgement manusia dengan menggunakan data berupa abstrak dokumen tugas akhir. Kata Kunci: Topic Modeling, Latent Dirichlet Allocation, Collapsed Gibbs Sampling.
Ringkasan Alternatif
Every year, senior student of Department of Computer Engineering are working on final project. Final project is required for every student in order to graduate. In working on the final project, references are needed. One of these references is final project report from the previous years. To search the final project document, Department of Computer Engineering provides a catalogue that contains list of final projects' titles. The problem is some of the title in the catalogue don't describe the content of the document. Therefore, it needs a way for people to find the right reference for their own final project'S title. One of many way to solve this problem is by using topic modeling. Research about topic modeling has been done by using Robust Probabilistic Latent Semantic Analysis (RPLSA) method which is an extension of Probabilistic Latent Semantic Analysis (PLSA) that provides solution to over fitting in PLSA. Based on the previous researches, it is concluded that extension of PLSA can be also achieved by using another approach called Latent Dirichlet Allocation(LDA). However, LDA needs estimation method because LDA cannot be implemented directly. There is an estimation method for LDA called Collapsed Gibbs Sampling. To determine whether the method is a good method for topic modeling, measurement about relevancy is performed by comparing group of documents using Collapsed Gibbs Sampling and using judgement from expert of topic of documents. The research shows that Collapsed Gibbs Sampling has the relevancy of 52.5% compared to human judgement based on the abstract of the final project report. Keywords: Topic Modeling, Latent Dirichlet Allocation, Collapsed Gibbs Sampling.
Sumber