Bahasa Indonesia memegang peran penting dalam komunikasi nasional, tetapi kompleksitas linguistiknya menghadirkan tantangan dalam implementasi Big Data pada robot humanoid. Penelitian ini mengkaji tantangan tersebut dengan fokus pada pemrosesan bahasa alami (Natural Language Processing/NLP) dan dataset lokal. Dengan menggunakan metodologi tinjauan pustaka, penelitian ini mengidentifikasi isu-isu utama, seperti morfologi aglutinatif, keberagaman dialek, dan variasi idiomatik. Teknologi NLP canggih, termasuk IndoNLI dan IndoSentiment, dievaluasi atas kontribusinya dalam mengatasi kompleksitas ini. Temuan menunjukkan bahwa integrasi dataset yang representatif dan penyesuaian model NLP secara lokal dapat meningkatkan kemampuan interaksi robot. Studi kasus seperti Lumen dan pendekatan dekoder multi-pass menunjukkan solusi efektif untuk pengenalan suara dan pembuatan respons. Rekomendasi menekankan pada pengembangan dataset lokal dan peningkatan sistem NLP untuk menciptakan interaksi manusia-robot yang lebih alami. Penelitian ini berkontribusi dalam menjembatani tantangan linguistik pada robotika humanoid untuk aplikasi yang lebih efektif di bidang layanan publik dan pendidikan.
                        
                        
                        
                        
                            
                                Copyrights © 2025