Logo Eventkampus
Perpustakaan judul masih dalam tahap pengembangan, admin siap menampung kritik dan saran
Implementasi Term Frequency Inverse Document Frequency TF IDF dan Vector Space Model Untuk Klasifikasi Berita Bahasa Indonesia
Taufik Ismail Efendi NIM. (2016) | Skripsi | Teknik Informatika
Bagikan
Ringkasan
Berita adalah cerita atau keterangan mengenai kejadian atau peristiwa yang hangat. Berita haruslah sesuai dengan kenyataan yang ada, tidak dibuat-buat (fiktif), dan terbaru atau terkini. Berita merupakan salah satu cara berkomunikasi melalui peristiwa penting, terbaru, dan menarik. Berita dapat dijumpai dimana saja seperti di koran, majalah, internet, televisi, radio, bahkan di mading sekolah. Sebuah berita harus mengandung unsur 5W+1H (What, Who, When, Where, Why,dan How) supaya pembaca dapat mengetahui lebih banyak tentang suatu kejadian. Dalam tahun ke tahun jumlah berita semakin bertambah banyak, maka proses pencarian dan penyajian dokumen berita menjadi lebih sukar atau sulit sehingga minimbulkan beberapa berita yang tidak terklasifikasi kategori sesuai isi berita tersebut, akan lebih mudah jika dokumen berita tersebut sudah tersedia sesuai dengan kategorinya klasifikasinya masing-masing. Untuk membantu menyelesaikan permasalahan tersebut dibangun sistem sebagai alat bantu untuk klasifikasi otomatis dengan menggunakan metode Term frequency-inverse document frequency (TF-IDF) dan Vector space model (VSM). Data berita akan diproses melalu sistem untuk mengetahui klasifikasi dari berita tersebut. Hasil dari pengujian ini dengan menggunakan metode frequency-inverse document frequency (TF-IDF) dan vector space model dari 50 data uji berita hanya 7 yang tidak sesuai dengan kategorinya.
Ringkasan Alternatif
News is a story or a description of the event or events that warm. News must be in accordance with the facts, not contrived (fictitious), and the newest or latest. News is a way to communicate through important events, current and interesting. We can find the news anywhere such as in newspapers, magazines, internet, television, radio, even in the school corridors. A news should contain elements of 5W + 1H (What, Who, When, Where, Why, and How) so that readers can find out more about an incident. In the years the number of news more and more, then the search process and presentation of news documents becomes more difficult or difficult that minimbulkan some news unclassified categories according to the content of the news, it would be easier if the news documents already provided in accordance with the respective classification category respectively. To help resolve these issues as a system built for automated classification tools by using methods Term frequency-inverse document frequency (TF-IDF) and the vector space model (VSM). News data to be tested will be processed through the system to determine the classification of the news. In this test the data used is data captured Indonesian news from online media. The results of this test with using frequency-inverse document frequency (TF-IDF) and the vector space model of the 50 test data 7 is not the only news by category.
Sumber