Neneng Nurhamidah
Universitas Jenderal Achmad Yani

Published : 2 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 2 Documents
Search

Perintah Menggunakan Sinyal Suara dengan Mel-Frequency Cepstrum Coefficients dan Learning Vector Quantization Neneng Nurhamidah; Esmeralda C. Djamal; Ridwan Ilyas
Seminar Nasional Aplikasi Teknologi Informasi (SNATI) 2017
Publisher : Jurusan Teknik Informatika, Fakultas Teknologi Industri, Universitas Islam Indonesia

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Perkembangan teknologi informasi mengarahkan perintah komputer tidak hanya dari keyboard, mouse ataupun touchscreen, tetapi dapat menggunakan suara atau pikiran. Persoalan utama dari instruksi suara adalah identifikasi kata yang diucapkan sehingga perlu proses ekstraksi yang tepat. Beberapa penelitian terdahulu mengidentifikasi suara dengan menggunakan Mel-Frequency Cepstrum Coefficients (MFCC) untuk mengoperasikan komputer, instruksi lampu otomatis dan penguncian pintu. Sementara penelitian lain menggunakan Linier Predictive Cepstral Coefficients sebagai pembanding MFCC dengan hasil akurasi MFCC lebih baik ketika mengenali suara dalam kondisi bising.  MFCC memiliki kemiripan dengan sistem pendengaran manusia serta merupakan perhitungan yang kuat dan hemat biaya. Penelitian ini telah membuat sistem identifikasi kata. Identifikasi dibagi atas tiga kelas yaitu “Klasik”, “Dangdut” dan “Pop”, yang digunakan untuk aksi mengoperasikan tiga jenis lagu yang sesuai. Sinyal suara diekstraksi menggunakan MFCC yang kemudian diidentifikasi menggunakan Learning Vector Quantization (LVQ). Data latih dan data uji didapatkan dari enam naracoba dan 10 kali perulangan dari yang mengucapkan kata “Klasik”, “Dangdut” dan “Pop” secara terpisah. Kemudian sinyal suara yang direkam dilewatkan praproses menggunakan Histogram Equalization, DC Removal  dan Pre-emphasize untuk mereduksi noise dari sinyal suara, yang kemudian diekstraksi menggunakan MFCC. Spektrum frekuensi yang dihasilkan dari MFCC diidentifikasikan menggunakan LVQ setelah melewati proses pelatihan terlebih dahulu. Hasil penelitian diperoleh akurasi sebesar 92% untuk identifikasi data yang telah dilatih. Sedangkan pengujian data baru diperoleh akurasi sebesar 46%.
Spoken Word Recognition Using MFCC and Learning Vector Quantization Esmeralda C. Djamal; Neneng Nurhamidah; Ridwan Ilyas
Proceeding of the Electrical Engineering Computer Science and Informatics Vol 4: EECSI 2017
Publisher : IAES Indonesia Section

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (398.748 KB) | DOI: 10.11591/eecsi.v4.1043

Abstract

Identification of spoken word(s) can be used to control external device. This research was result word identification in speech using Mel-Frequency Cepstrum Coefficients (MFCC) and Learning Vector Quantization (LVQ). The output of system operated the computer in certain genre song appropriate with the identified word. Identification was divided into three classes contain words such as "Klasik", "Dangdut" and "Pop", which are used to playing three types of accordingly songs. The voice signal is extracted by using MFCC and then identified using LVQ. The training and test set were obtained from six subjects and 10 times trial of the words "Klasik", "Dangdut" and "Pop" separately. Then the recorded sound signal is pre-processed using Histogram Equalization, DC Removal and Pre-emphasize to reduce noise from the sound signal, and then extracted using MFCC. The frequency spectrum generated from MFCC was identified using LVQ after passing through the training process first. Accuracy of the testing results is 92% for identification of training sets while testing new data recorded using different SNR obtained an accuracy of 46%. However, the test results of new data recorded using the same SNR with training data has an accuracy of 75.5%.