p-Index From 2020 - 2025
0.408
P-Index
This Author published in this journals
All Journal EXPLORE Explore
Claim Missing Document
Check
Articles

Found 2 Documents
Search

Analisis Fitur dan Convolutional Neural Network pada Pengenalan Aksen Ucapan Dwi Sari Widyowaty
Jurnal Explore Vol 11, No 2 (2021): JULI
Publisher : Universitas Teknologi Mataram

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (259.721 KB) | DOI: 10.35200/explore.v11i2.430

Abstract

Each country has its characteristics and culture, one of these characteristics is the accent of speech. By listening to someone's accent, we can identify the country of origin of the speaker. Research on accent recognition includes Automatic Speech Recognition (ASR) Technology which is currently being developed, an example of ASR technology, namely Virtual Assistant, the development of this research can be more intelligent Virtual Assistant because it can provide an accent from a speaker. In this study, the authors tried to classify accents from various countries (5 classes), namely English, Spanish, Mandarin, French and Arabic. The dataset used in this study consists of English 627 audio, Spanish 220 audio, Mandarin 132 audio, French 80 audio, and Arabic 172 audio, where all sentences are the same sentence in English. In this study, the audio features used are Mel - Frequency Cepstral Coefficients (MFCC), Zero Crossing Rate (ZCR), and Energy (in librosa it is called RMS). Audio feature extraction generates an array of each audio, the result of audio feature extraction will be the Convolutional Neural Network (CNN) Method input for classifying the accent. This research resulted in 51.30% accuracy for the MFCC feature, 48.05% for the ZCR feature, and 51.95% for the Energy feature. The Energy feature gets good accuracy, followed by the MFCC and ZCR features.
Analisis Fitur dan Convolutional Neural Network pada Pengenalan Aksen Ucapan Dwi Sari Widyowaty; Andi Sunyoto; Hanif Al Fatta
Explore Vol 11 No 2 (2021): Juli 2021
Publisher : Universitas Teknologi Mataram

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.35200/ex.v11i2.45

Abstract

Setiap negara memiliki ciri khas dan budaya masing-masing, salah satu ciri khas tersebut yaitu aksen ucapan, dengan mendengarkan aksen ucapan seseorang, maka dapat dikenali asal negara dari pembicara tersebut. Penelitian mengenai pengenalan aksen termasuk pada Teknologi Automatic Speech Recognition (ASR) yang sekarang ini sedang berkembang, contoh dari pemanfaatan teknologi ASR yaitu Asisten Virtual, pengembangan penelitian ini dapat menuju Asisten Virtual yang lebih cerdas karena dapat mengenali aksen dari seorang pembicara. Pada penelitian ini, penulis mencoba mengklasifikasikan aksen dari berbagai Negara (5 kelas) yaitu English, Spanish, Mandarin, French dan Arabic. Dataset yang digunakan pada Penelitian ini berjumlah 1231 rekaman suara yang terdiri dari English 627 audio, Spanish 220 audio, Mandarin 132 audio, French 80 audio, dan Arabic 172 audio, dimana seluruh pembicara mengucapkan kalimat yang sama dalam bahasa Inggris. Pada penelitian ini fitur audio yang digunakan yaitu Mel – Frequency Cepstral Coefficients (MFCC), Zero Crossing Rate (ZCR), dan Energy (pada librosa disebut RMS). Ekstraksi Fitur audio menghasilkan array dari setiap audio, hasil ekstraksi fitur audio akan menjadi masukan Metode Convolutional Neural Network (CNN) untuk mengklasifikasikan aksen tersebut. Penelitian ini menghasilkan akurasi 51.30 % pada fitur MFCC, 48.05 % pada fitur ZCR, dan 51,95 % pada fitur Energy. Fitur Energy mendapatkan akurasi yang baik, kemudian diikuti dengan fitur MFCC dan ZCR.