Implementasi Pengenalan Ucapan Otomatis untuk memprediksi bacaan sering digunakan dalam kehidupan sehari-hari. Salah satu tujuan yang dilakukan penelitian ini adalah untuk mengurangi angka buta mengaji Al-Qur'an pada umat Islam dengan mengimplementasikan ASR sebagai prediksi huruf hijaiyah dan membaca dengan teks ayat-ayat suci Al-Qur'an sebagai target. Data diambil dari platform YouTube dengan suara-suara murottal dari Syeikh Mahmoud Al-Hussary. Ada banyak metode deep learning ASR yang dapat digunakan untuk memprediksi kata ( transcribing ), contohnya adalah Wav2vec 2.0 dan OpenAI-Whisper . Hasil dari metode Wav2vec 2.0 menunjukkan nilai Character Error Rate (CER) dalam memprediksi ayat suci Al-Qur'an dari jarak 0.226 (23%) ~ 0.677 (68%). Hasil dari metode OpenAI-Whisper menunjukkan performa yang lebih bagus daripada Wav2vec 2.0 dengan nilai Character Error Rate (CER) dari rentang 0.064 (6%) ~ 0.172 (17%). Hasil dari kedua metode yang telah diusulkan mengimplikasikan bahwa nilai error yang rendah menjadi metode yang terbaik dengan kesalahan yang minimal.
Copyrights © 2024