Claim Missing Document
Check
Articles

Found 2 Documents
Search

Implementasi Automatic Speech Recognition Bacaan Al-Qur’an Menggunakan Metode Wav2Vec 2.0 dan OpenAI-Whisper Ferdiansyah, Danny; Aditya, Christian Sri Kusuma
Jurnal Teknik Elektro dan Komputer TRIAC Vol 11, No 1 (2024): Mei 2024
Publisher : Jurusan Teknik Elektro Universitas Trunojoyo Madura

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.21107/triac.v11i1.24332

Abstract

Implementasi Pengenalan Ucapan Otomatis untuk memprediksi bacaan sering digunakan dalam kehidupan sehari-hari. Salah satu tujuan yang dilakukan penelitian ini adalah untuk mengurangi angka buta mengaji Al-Qur'an pada umat Islam dengan mengimplementasikan ASR sebagai prediksi huruf hijaiyah dan membaca dengan teks ayat-ayat suci Al-Qur'an sebagai target. Data diambil dari platform YouTube dengan suara-suara murottal dari Syeikh Mahmoud Al-Hussary. Ada banyak metode deep learning ASR yang dapat digunakan untuk memprediksi kata ( transcribing ), contohnya adalah Wav2vec 2.0 dan OpenAI-Whisper . Hasil dari metode Wav2vec 2.0 menunjukkan nilai Character Error Rate (CER) dalam memprediksi ayat suci Al-Qur'an dari jarak 0.226 (23%) ~ 0.677 (68%). Hasil dari metode OpenAI-Whisper menunjukkan performa yang lebih bagus daripada Wav2vec 2.0 dengan nilai Character Error Rate (CER) dari rentang 0.064 (6%) ~ 0.172 (17%). Hasil dari kedua metode yang telah diusulkan mengimplikasikan bahwa nilai error yang rendah menjadi metode yang terbaik dengan kesalahan yang minimal.
Pengolahan Korpus Dataset Audio Bacaan Al-Qur"™an Menggunakan Metode Wav2Vec 2.0 Aminudin, Aminudin; Nuryasin, Ilyas; Amien, Saiful; Wicaksono, Galih Wasis; Chandranegara, Didih Rizki; Thoifah, I'anatut; Rizky, Wahyu; Ferdiansyah, Danny; Azzahra, Kiara; Lathifah, Fildzah; Aulyah, Khairunnisa
JEPIN (Jurnal Edukasi dan Penelitian Informatika) Vol 10, No 1 (2024): Volume 10 No 1
Publisher : Program Studi Informatika

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/jp.v10i1.71576

Abstract

Pengembangan sistem otomasi pengenalan ucapan (Automatic Speech Recognition/ASR) di dalam membaca Al-Qur'an dibutuhkan korpus data audio bacaan Al-Qur'an dan beranotasi dengan transkripsi tekstual agar dapat diproses oleh algoritma machine learning. Pemrosesan Korpus dataset ini dibangun mengingat belum adanya dataset beserta pemrosesanya menggunakan metode tertentu untuk keperluan riset di dalam pengembangan ASR. Paper ini menyajikan kumpulan corpus dataset dan pengolahannya menggunakan metode Wav2Vec 2.0 dengan total 24 ribuan dataset hasil dari rekaman dari 170 santri dengan jenjang umur 4 sampai dengan 16 tahun. Pemrosesan korpus dataset dibuat mengikuti standar metode Wav2Vec 2.0 agar dapat digunakan sebagai data latih pada pemrosesan machine learning. Wav2Vec merupakan model yang dapat mempelajari representasi vektor dari masukan sinyal suara dengan proses pembelajaran self-supervised learning. Wav2Vec juga mampu menangani perbedaan aksen dan karakteristik pembaca Al-Qur'an yang bervariasi dan lebih akurat karena menggunakan deep learning. Dari hasil pengujian menggunakan parameter Precision didapatkan hasil accuracy sebesar 65.52%, precision dengan nilai 0.83 Recall dengan nilai 0.66 dan F1-Score dengan nilai 0.73 serta Word Error Rate (WER) dengan nilai 0.5. Diharapkan dengan adanya pemrosesan korpus dataset ini dapat membantu pengembangan dan riset terkait automasi sistem bacaan Al-Qur'an dengan teknik deep learning dan meningkatkan minat generasi milenial untuk belajar Al-Qur'an dengan memanfaatkan teknologi terkini.