Perpustakaan judul masih dalam tahap pengembangan, admin siap menampung kritik dan saran
Aplikasi Pembuat Transcript Rekaman Audio Percakapan Customer Care PT Telekomunikasi Indonesia Tbk.
Kivlan Aziz Al (2020) | Tugas Akhir | Teknik Informatika , Teknik Komputer
Bagikan
Ringkasan
Dengan perkembangan teknologi saat ini, kebutuhan teknologi multimedia komputasi semakin besar, salah satu teknologi pada bidang multimedia yang diangkat pada laporan ini adalah pengolahan sinyal audio. Masalah yang dihadapi oleh Telkom Indonesia adalah untuk mengubah rekaman percakapan yang terjadi di call center menjadi teks yang terurut sesuai dengan waktu pembicaranya. Audio merupakan getaran yang merambat sampai kepada telinga manusia. Audio yang diproses dan direkam melalui perangkat keras elektronik disebut dengan audio digital. Pada audio digital terdapat properti yang mempengaruhi bagaimana audio tersebut terdengar oleh manusia. Dengan pengetahuan tentang properti audio tersebut, audio dapat dimanipulasi dengan rumus matematika sehingga dapat bertransformasi menjadi audio yang lebih berarti. Aplikasi ini dibangun dengan menggabungkan beberapa tahapan dan metode. Tahapan yang dibangun di antaranya adalah pre-processing, processing dan proses pembuatan transkrip. Pada tahap pre-processing, noise reduction dilakukan dengan menggunakan metode bandpass dan background noise reduction. pada tahap processing dilakukan dengan menggunakan metode speaker diarization untuk memberi label pembicara pada audio dalam rentang waktu tertentu. Pada tahapan transkrip, digunakan servis Google speech to text, kemudian hasil dari transkrip digabung dan diurutkan sehingga membentuk sebuah dialog. Akurasi pemisahan suara yang dihasilkan sebesar 58.52%.
Ringkasan Alternatif
With the development of current technology, the need for multimedia technology is getting bigger, one of the technologies in the multimedia field that raised in this report is audio signal processing. The problem faced by Telkom Indonesia is to change the recording of conversations in the call center into text according to the conversation sequence. Audio is a vibration that propagates to the human ear. Audio that is processed and recorded through electronic hardware is called digital audio. In digital audio there are properties that affect how the audio is heard by humans. With knowledge of audio properties, these properties can be manipulated using mathematical formulas, so the audio can be transformed into more meaningful audio. This application was built using several stages and methods, the stages include pre-processing, processing and transcript processes. At pre-processing, noise reduction is done by using the bandpass method and background noise reduction. The processing stage is done by using the speaker diarization method to label the speakers on the audio in a certain time span. At the stage of the transcript processes, the Google speech to text service is used, then the results of the transcript are merged and sorted to form a dialogue. This application has 58.52% accuracy on speaker separation process.