Decode: Jurnal Pendidikan Teknologi Informasi
Vol. 4 No. 3: NOVEMBER 2024

Identifikasi Fitur Suara Menggunakan Model Convolutional Neural Network (CNN) pada Speech-to-Text (STT)

Rodiah (Unknown)
Susetianingtias, Diana Tri (Unknown)
Eka Patriya (Unknown)



Article Info

Publish Date
05 Oct 2024

Abstract

Identifikasi pola ucapan dilakukan untuk dapat mengenali kata yang diucapkan. Salah satu metode yang dapat digunakan untuk mengidentifikasi Speech-to-Text (STT) adalah dengan menggunakan Convolutional Neural Network (CNN). Penelitian ini menggunakan metode CNN untuk mengidentifikasi STT pada raw speech dari sejumlah 23000 data dari open dataset suara Kaggle. Tahap awal dilakukan resampling durasi, untuk mengambil data rekaman yang memiliki durasi yang cukup untuk masuk dalam proses selanjutnya yaitu inisialisasi frekuensi. Tahap ini mengubah frekuensi asli dari suara rekaman. Inisialisasi dilakukan dengan mengubah frekuensi dari 16000Hz menjadi rentang 8000Hz. Tahap selanjutnya pelabelan data, yaitu data input dan output diberi label untuk klasifikasi sebagai dasar pembelajaran untuk pemrosesan data. Data yang sudah dilabeli kemudian dilakukan pembagian kedalam rasio 8:2. Tahap Akhir Perancangan arsitektur model CNN dilakukan untuk dapat mengenali pola suara yang sudah direkam pada dataset dan dapat mengidentifikasi ucapan. Hasil penelitian bertujuan untuk mengidentifikasi pola suara yang diucapkan dengan akurasi tinggi.

Copyrights © 2024






Journal Info

Abbrev

decode

Publisher

Subject

Computer Science & IT Control & Systems Engineering Education Languange, Linguistic, Communication & Media Other

Description

DECODE: Jurnal Pendidikan Teknologi Informasi publishes articles in English and Indonesian which will be published 3 times a year, namely March, July and November. Articles that can be considered for publication in this journal are the results of research that is in accordance with the focus and ...