Logo Eventkampus
Perpustakaan judul masih dalam tahap pengembangan, admin siap menampung kritik dan saran
Pembangunan Kamus Jenis Kata Sebagai Sumber Daya NLP Bahasa Indonesia
Ceppy Efraim C G B NIM. (2016) | Skripsi | Teknik Informatika
Bagikan
Ringkasan
Kamus adalah buku referensi yang memuat daftar kata atau gabungan kata dengan keterangan mengenai pelbagai segi maknanya dan penggunaannya dalam ahasa, biasanya disusun menurut abjad. Selain dalam bentuk buku, saat ini kamus dijumpai berupa kamus digital yang dapat diakses secara online. Pengembangan kamus online Bahasa Indonesia tidak disertai dengan sumber daya, dengan kata lain pengguna hanya memakai dan tidak mempunyai hak akses untuk mengubah atau menambahkan. Sumber daya kamus berguna sebagai data masukan seperti kata dasar, jenis kata, stopword, korpus, dalam pengklasifikasian kelas kata pada proses Question-Answering, language generator, information extraction, summarization, machine translation dan lain-lain. Berdasarkan kebutuhan akan sumber daya maka, penelitian yang dilakukan adalah pembangunan kamus jenis kata yang diharapakan mampu menghasilkan sumber daya yang dapat digunakan dalam pengembangan bahasa dalam bidang NLP. Sumber masukan yang dikelola adalah kbbi format .txt, dengan pengklasifikasian 7 kelas kata merunut Tata Bahasa Baku Bahasa Indonesia. Tahap pengambilan kata dan jenis kata terdiri dari sepuluh langkah yaitu penghilangan digit di awal kata, penghilangan spasi kosong di awal kalimat, penghilangan baris di awali simbol, penghilangan blankline, penghilangan spasi ganda, penghilangan simbol kecuali strip”-“, penghilangan baris kurang dari dua kata, pengambilan kata dan jenis kata, pengecekan kata, dan pengurutan sehingga menghasilkan format kata diikuti jenis kata selanjutnya disimpan dalam database. Hasil akhir dari pembangunan kamus jenis kata adalah database kamus jenis kata dalam tiga format dan kamus online sebagai implementasi. Kamus yang dibangun tidak mengolah kata majemuk. Hasil pengujian pembangunan kamus jenis kata menghasilkan 38.870 lema. Selain dapat bebas menggunakan sumber daya kamus, diharapkan pengguna dapat mengembangkan sistem yang dibangun.
Ringkasan Alternatif
The dictionary is a reference book that lists words or combined words with information on the various facets of its meaning and its use in the language, usually organised alphabetically. Other than in book form, the current dictionary is found in the form of a digital dictionary can be accessed online. Development of an online dictionary Indonesian Language accompanied by resources, in other words the user just wear and does not have the permissions to change or add. A resource dictionary is useful as input data such as the basic Word, kind words, stopword, corpus, in which particular class said on Question-Answering process, language generator, information extraction, summarization, machine translation, etc. Based on the need for resources, then the research conducted is the construction dictionary type words that are expected to produce resources that can be used in the development of languages in the field of NLP. The input source is managed kbbi .txt, with 7 classes in which the word tracing Raw Indonesian Language Grammar. Phase retrieval of words and kind words consists of ten steps i.e. removal of digits at the beginning of words, removal of empty space at the beginning of a sentence, removing lines on the start symbol, omission, omission blankline double-spaced, except for the omission of the symbol "-" strip, removal of the line less than two words, taking words and kind words, Word checking and sequencing, resulting in a format Word followed further word types stored in the database. The final result of the building of a dictionary kind words is the database dictionary type words in three formats and online dictionary as the implementation. The dictionary is built not cultivate compounds. The test results of the development dictionary kind words produce 38,870 lema. In addition to free use of the resource dictionaries, user can be expected to develop a system that is built.
Sumber
Judul Serupa
  • Pembangunan Kamus Bahasa Indonesia Sebagai Sumber Daya NLP Bahasa Indonesia
  • Pengembangan Kamus Jenis Kata Yang Dilengkapi Kata Majemuk Sebagai Sumber Daya NLP Bahasa Indonesia
  • Pengembangan Penteksian Kamus Jenis Kata Sebagai Sumber Daya NLP Bahasa Indonesia
  • Pembangunan Sumber Daya Kamus Sinonim Bahasa Indonesia