Perpustakaan judul masih dalam tahap pengembangan, admin siap menampung kritik dan saran
Perangkat Lunak Untuk Membuka Aplikasi Pada Komputer Dengan Perintah Suara menggunakan Metode Mel Frequency Cepstrum Coefficients (MFCC)
Anna Dara Andriana (2011) | Skripsi | Teknik Informatika
Bagikan
Ringkasan
Perangkat lunak yang dibangun pada tugas akhir ini adalah sebuah program yang dapat membuka aplikasi pada komputer menggunakan perintah suara (voice command). Secara umum suara yang masuk akan dicocokan dengan data suara yang telah ada. Jika hasil dari pencocokan sama, maka sistem akan mengeksekusi aplikasi yang telah ditentukan sebelumnya. Permasalahannya adalah bagaimana komuter dapat mengerti perintah yang diucapkan oleh manusia.br /
Metode yang digunakan dalam feature extraction adalah Mel frequency Cepstrum Coefficients (MFCC). Dalam MFCC sendiri terdapan tujuh tahapan yaitu, Pre-emphasis, Frame Blocking, Windowing, Fast Fourier Transform, Mel Frequency Waping, Discrete Cosine Transform dan Cepstral Liftering. Untuk mengurangi waktu pemrosesan saat pencocokan suara maka digunakan K-Means Clustering untuk membuat vektor data sebagai representasi dari keseluruhan sampel data yang ada. Aplikasi voice command ini dibangun menggunakan Microsoft visual basic 6.br /
Pada pengujian didapatkan persentase keberhasilan sebesar 70,5% dalam hal keakuratan perintah suara yang diujikan terhadap seribu sampel data yang ada. Data tersebut didapatkan dari sepuluh orang yang terdiri dari lima orang wanita dan lima orang pria. Untuk memaksimalkan performa aplikasi, diperlukan suasana lingkungan yang tenang, agar aplikasi dapat berjalan dengan benar.
Ringkasan Alternatif
Software was build for this final project is an application which can open programs in computer using voice (Voice command). Globally, voice will agreeable with data in database. If the value is same, then system will execute programs which choseed before.br /
For feature extraction, we used Mel frequency Cepstrum Coefficiens (MFCC) Method. In MFCC itself, we have seven stage, first is Pre-emphasis then Frame Blocking, Windowing, Fast Fourier Transform, Mel Frequency Waping, Discrete Cosine Transform and Cepstral Liftering. For reduse time, we used K-Means Clustering for made some data vektor which representation all the data sample. This voice command application was build using Microsoft visual Basic 6.br /
In testing, we get presentation of accuration for the success up to 70,5% from a thousand data sample . We can get the value from ten people, which trying this application. They are five people girl and five people boy. For the application performance, we need silence room , so that application wil be in good performance.