Korpus bahasa indonesia masih terkendala oleh keterbatasan sumber daya, hal itu dikarenakan kurangnya perhatian pemerintah terhadap penelitian kebahasaan serta waktu yang diperlukan untuk membangun korpus yang luas dan beragam. Penelitian ini bertujuan untuk mendukung pengembangan Natural Language Processing (NLP) di Indonesia melalui perancangan sistem Text-to-Speech (TTS) berbasis Diphone Concatenation. Database yang digunakan mencakup 2000 kata dan 225 potongan kata (Diphone) yang dimuat dalam bentuk korpus bahasa Indonesia. Evaluasi sistem dilakukan berdasarkan keberhasilan konversi teks ke suara serta penilaian kualitas suara menggunakan Mean Opinion Score (MOS). Pengujian dilakukan melalui lima skenario dengan tiga aspek utama: kejelasan ucapan (Intelligibility), kelancaran pengucapan (Fluidity), dan kealamian suara (Naturalness). Sistem Text-to-Speech yang dirancang mencapai akurasi 100% dalam melakukan konversi teks ke suara untuk kata-kata dalam database. Penilaian MOS menghasilkan skor rata-rata 3,7 untuk kejelasan, 3,7 untuk kelancaran, dan 3,8 untuk kealamian ucapan. Dengan demikian, sistem TTS yang dikembangkan mampu menghasilkan suara yang jelas, transisi antar Diphone yang lancar, serta intonasi yang lebih alami, mendekati pengucapan manusia pada umumnya.
Copyrights © 2025