YouTube telah berkembang menjadi instrumen vital dalam Learning Analytics untuk mendukung pembelajaran mandiri, khususnya pada materi pemrograman. Kolom komentar pada platform ini menyimpan wawasan berharga mengenai persepsi peserta didik, namun karakteristik data yang masif, tidak terstruktur, dan mengandung noise menyulitkan proses ekstraksi informasi secara manual. Penelitian ini bertujuan untuk membangun sistem analisis komentar yang komprehensif dengan mengintegrasikan metode klasterisasi topik dan klasifikasi sentimen. Data penelitian terdiri dari 5.360 komentar bersih yang diakuisisi melalui teknik web scraping dan direpresentasikan menggunakan fitur TF-IDF. Penelitian ini membandingkan kinerja algoritma klasterisasi DBSCAN dan K-Medoids, serta algoritma klasifikasi sentimen Random Forest dan Naïve Bayes dengan pelabelan otomatis VADER. Hasil pengujian menunjukkan bahwa metode K-Medoids terbukti lebih unggul dan stabil dibandingkan DBSCAN dalam menangani karakteristik data teks berdimensi tinggi, dengan capaian Silhouette Score sebesar 0.62 pada 2 klaster optimal. Analisis LDA mengungkap dua pola interaksi dominan: klaster "Apresiasi" yang didominasi sentimen positif dan klaster "Masalah Teknis" yang didominasi sentimen negatif dan netral. Pada tahap klasifikasi, algoritma Random Forest menunjukkan performa superior pada Klaster Apresiasi dengan akurasi mencapai 91,67% dan F1-Score 91%, mengungguli Naïve Bayes yang hanya mencapai akurasi 80,56%. Penelitian ini menyimpulkan bahwa integrasi K-Medoids dan Random Forest merupakan pendekatan efektif untuk memetakan topik diskusi sekaligus memprediksi sentimen pengguna secara akurat.
Copyrights © 2026