Aulyah, Khairunnisa
Unknown Affiliation

Published : 1 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 1 Documents
Search

Pengolahan Korpus Dataset Audio Bacaan Al-Qur’an Menggunakan Metode Wav2Vec 2.0 Aminudin, Aminudin; Nuryasin, Ilyas; Amien, Saiful; Wicaksono, Galih Wasis; Chandranegara, Didih Rizki; Thoifah, I'anatut; Rizky, Wahyu; Ferdiansyah, Danny; Azzahra, Kiara; Lathifah, Fildzah; Aulyah, Khairunnisa
JEPIN (Jurnal Edukasi dan Penelitian Informatika) Vol 10, No 1 (2024): Volume 10 No 1
Publisher : Program Studi Informatika

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/jp.v10i1.71576

Abstract

Pengembangan sistem otomasi pengenalan ucapan (Automatic Speech Recognition/ASR) di dalam membaca Al-Qur'an dibutuhkan korpus data audio bacaan Al-Qur'an dan beranotasi dengan transkripsi tekstual agar dapat diproses oleh algoritma machine learning. Pemrosesan Korpus dataset ini dibangun mengingat belum adanya dataset beserta pemrosesanya menggunakan metode tertentu untuk keperluan riset di dalam pengembangan ASR. Paper ini menyajikan kumpulan corpus dataset dan pengolahannya menggunakan metode Wav2Vec 2.0 dengan total 24 ribuan dataset hasil dari rekaman dari 170 santri dengan jenjang umur 4 sampai dengan 16 tahun. Pemrosesan korpus dataset dibuat mengikuti standar metode Wav2Vec 2.0 agar dapat digunakan sebagai data latih pada pemrosesan machine learning. Wav2Vec merupakan model yang dapat mempelajari representasi vektor dari masukan sinyal suara dengan proses pembelajaran self-supervised learning. Wav2Vec juga mampu menangani perbedaan aksen dan karakteristik pembaca Al-Qur'an yang bervariasi dan lebih akurat karena menggunakan deep learning. Dari hasil pengujian menggunakan parameter Precision didapatkan hasil accuracy sebesar 65.52%, precision dengan nilai 0.83 Recall dengan nilai 0.66 dan F1-Score dengan nilai 0.73 serta Word Error Rate (WER) dengan nilai 0.5. Diharapkan dengan adanya pemrosesan korpus dataset ini dapat membantu pengembangan dan riset terkait automasi sistem bacaan Al-Qur'an dengan teknik deep learning dan meningkatkan minat generasi milenial untuk belajar Al-Qur'an dengan memanfaatkan teknologi terkini.