Perpustakaan judul masih dalam tahap pengembangan, admin siap menampung kritik dan saran
Perbandingan Sistem Klasifikasi Decision Tree ID3 dengan Sistem Klasifikasi Decision Tree C4.5 dengan Studi Kasus Klasifikasi Dokumen Teks Bahasa Indonesia
Atin Supriatiningsih (2017) | Skripsi | Teknik Informatika , Teknik Komputer
Bagikan
Ringkasan
Penyebaran informasi melalui internet semakin berkembang dengan pesat, sehingga menyebabkan jumlah dokumen teks seperti artikel berita terus bertambah dan tidak terkategori. Dari permasalahan tersebut, klasifikasi menjadi sangat penting. Klasifikasi merupakan penentuan suatu object kedalam kelompok yang telah ditentukan sebelumnya.Metode klasifikasi yang dapat digunakan adalah Decision Tree C4.5 dan Decision Tree ID3. Tugas Akhir ini, membandingkan kedua metode tersebut untuk mengkaji performa dari masing-masing metode dan untuk mengetahui metode mana yang paling baik dalam mengklasifikasi dokumen teks bahasa Indonesia. Pada eksperimen pertama menggunakan 70 artikel berita olahraga, yang terdiri atas 46 data pelatihan dan 24 data pengujian yang diperoleh dari website olahraga online. Eksperimen kedua menggunakan 100 artikel dengan 80 artikel sebagai data training dan 20 artikel sebagai data uji. Hasil yang diperoleh pada eksperimen pertama menunjukan penggunaan metode Decision Tree C4.5 menghasilkan nilai akurasi lebih unggul yaitu mencapai 79,2%, sedangkan penggunaan metode Decision Tree ID3 nilai akurasinya 75%. Hasil yang diperoleh pada eksperimen kedua menunjukkan penggunaan metode Decision Tree C4.5 menghasilkan nilai akurasi lebih unggul yaitu mencapai 85%, sedangkan penggunaan metode Decision Tree ID3 nilai akurasinya 65%. Dari hasil eksperimen diatas, Decision Tree C4.5 lebih unggul daripada Decision Tree ID3. Hal tersebut bertentangan dengan hipotesa yang ada. Namun demikian, dari eksperimen ini dapat dipelajari lebih jauh bagaimana perilaku dari Decision Tree C4.5 yang lebih baik dibandingkan dengan Decision Tree ID3. Kata Kunci: Klasifikasi teks,Decision Tree C4.5,Decision Tree ID3, dokumen teks berbahasa Indonesia.
Ringkasan Alternatif
Dissemination of information via the internet is growing rapidly, causing the number of news articles continue to grow and uncategorized. From the problem above, classification becomes very important. Classification determines an object into a category which has been defined before. The classification method which can be used are Decision Tree C4.5 and Decision Tree ID3. This Final Project compared those methods to examine the performance of each method to know which method is better applied for bahasa Indonesia text classification. In the first experiment this study used 70 sport news articles as experiment data obtained from online sport website, with 46 training data and 24 test data. In the second experiment this study used 100 sport news articles as test data, with 80 articles as data training and 20 articles as test data. The result from the first experiment showed that the Decision Tree C4.5 method produced excellent accuracy value which is 79,2%, where the Decision Tree ID3 method accuracy value is 75%. The result from the second experiment showed that the Decision Tree C4.5 method produced excellent accuracy value, reaching 85%, while the Decision Tree ID3 method accuracy value is 65%. From the experiment result above, C4.5 Decision Tree is more excellent than ID3 Decision Tree. This was contradicted with the hypotheses. However, from the experiment we can comprehend the behaviors of these two methods and learn how C4.5 better than ID3. Keywords: Text Classification, Decision Tree C4.5, Decision Tree ID3, Indonesian text classification.