Claim Missing Document
Check
Articles

Found 1 Documents
Search

Analisis Performa Naïve Bayes, K-Neares Neighbor, dan Random Forest dalam Klasifikasi Sentimen Ulasan Aplikasi Netflix Nurbaya, Yasinta; Sihombing, Rossiana; I, Harjanti Bhatara; Salsabila, Dian Sifa
RIGGS: Journal of Artificial Intelligence and Digital Business Vol. 5 No. 1 (2026): Februari - April
Publisher : Prodi Bisnis Digital Universitas Pahlawan Tuanku Tambusai

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.31004/riggs.v5i1.5886

Abstract

Dengan jutaan pengguna aktif di Indonesia, Netflix menjadi salah satu platform streaming digital terdepan yang terus berupaya menjaga kualitas layanan dan kepuasan penggunanya. Ulasan pengguna yang tersedia pada Google Play Store merepresentasikan sumber data penting yang mencerminkan persepsi, pengalaman, serta tingkat kepuasan konsumen terhadap layanan yang diberikan. Namun, besarnya jumlah ulasan dan bentuknya yang tidak terstruktur menuntut adanya pendekatan otomatis untuk menganalisis opini pengguna secara sistematis dan objektif. Penelitian ini bertujuan untuk mengkategorikan sentimen ulasan pengguna Netflix ke dalam tiga kelas, yaitu positif, negatif, dan netral, serta membandingkan kinerja algoritma klasifikasi machine learning yang digunakan. Penelitian ini mengimplementasikan tiga algoritma klasifikasi, yaitu Naïve Bayes, K-Nearest Neighbor (KNN), dan Random Forest, dengan memanfaatkan perangkat lunak Orange Data Mining. Proses penelitian meliputi tahap preprocessing data teks, ekstraksi fitur menggunakan metode Term Frequency–Inverse Document Frequency (TF-IDF), serta evaluasi model menggunakan teknik 10-fold stratified cross-validation. Kinerja model dievaluasi berdasarkan metrik akurasi, Area Under Curve (AUC), F1-score, precision, recall, dan Matthews Correlation Coefficient (MCC). Hasil penelitian menunjukkan bahwa algoritma Naïve Bayes menghasilkan performa terbaik dengan tingkat akurasi sebesar 99,2% dan nilai AUC sebesar 1,000, diikuti oleh Random Forest dengan akurasi 98,3% dan AUC 0,998. Sebaliknya, algoritma KNN menunjukkan performa terendah dengan akurasi 36,2% dan AUC 0,500. Analisis statistik mengonfirmasi adanya perbedaan performa yang signifikan antara Naïve Bayes dan KNN (p < 0,05). Temuan ini menunjukkan bahwa algoritma probabilistik berbasis Naïve Bayes lebih efektif dalam menangani data teks berdimensi tinggi dengan representasi TF-IDF.