Penelitian ini mengembangkan sistem pengenalan emosi ujaran berbahasa Indonesia menggunakan metode Bidirectional Long Short Term Memory (BiLSTM) dengan sumber data berupa ujaran alami dari podcast Malaka. Dataset diperoleh dari audio YouTube yang di konversi ke format WAV, disegmentasi, serta dilabeli emosi marah, netral, sedih dan senang berdasarkan acuan dataset CREMA-D. Tahapan prapemrosesan meliputi silce removal, normalisasi sinyal, dan augmentasi data. Ektrasi ciri dilakukan menggunakan Mel-Frequency Cepstral Coefficients (MFCC) beserta fitur delta dan delta-delta untuk mempresentasikan karakteristik spektral dan temporal sinyal suara. Model Bidirectional Long Short Term Memory dilatih dengan pembagian data 80% data latih, 10% data validasi, dan 10% data uji, serta dioptimasi dengan menggunakan algoritma adam. Hasil pengujian menunjukan bahwa model mencapai akurasi terbaik sebesar 80.32% dengan nilai pecision, recall, dan f1-score yang relatif seimbang pada seluruh kelas emosi. Hasil ini menunjukan bahwa Bidirectional Long Short Term Memory (BiLSTM) efektif dalam memodelkan dinamika temporal emosi pada ujaran podcast berbahasa indonesia.
Copyrights © 2026