Sistem pengenalan perintah suara berbasis keyword spotting (KWS) merupakan komponen penting dalam pengembangan kursi roda pintar, namun performanya rentan menurun pada lingkungan bising dan dibatasi oleh keterbatasan sumber daya komputasi pada perangkat edge. Penelitian ini bertujuan untuk mengevaluasi kombinasi model speech enhancement (SE) dan model KWS ringan serta menganalisis trade-off antara performa klasifikasi dan efisiensi komputasi. Evaluasi dilakukan menggunakan tiga arsitektur KWS ringan, yaitu BC-ResNet-1, MatchboxNet-3×2×64, dan TC-ResNet8, pada empat skenario pemrosesan sinyal, yaitu tanpa SE, RNNoise, DeepFilterNet, dan GTCRN. Performa sistem dievaluasi menggunakan metrik confusion matrix, sedangkan efisiensi komputasi dianalisis berdasarkan latensi inferensi, jumlah parameter, dan real-time factor. Selain itu, digunakan analisis statistik Generalized Estimating Equations untuk menguji signifikansi pengaruh model SE, model KWS, dan interaksi keduanya. Hasil eksperimen menunjukkan bahwa kombinasi GTCRN dan BC-ResNet menghasilkan performa klasifikasi tertinggi dengan akurasi 98,56%, sementara TC-ResNet8 menunjukkan efisiensi komputasi terbaik dengan latensi inferensi sekitar 1,79 ms. Hasil ini menunjukkan bahwa pemilihan metode SE dan arsitektur KWS perlu dilakukan secara kontekstual.
Copyrights © 2026