Maraknya komentar promosi judi online pada platform YouTube menimbulkan ancaman serius terhadap keamanan digital pengguna, khususnya kelompok muda yang rentan. Aktivitas ini melanggar Undang-Undang ITE Nomor 19 Tahun 2016 Pasal 27 Ayat 2 yang melarang distribusi konten perjudian di ruang digital. Penelitian ini bertujuan untuk menganalisis sentimen komentar judi online berbahasa Indonesia menggunakan algoritma K-Nearest Neighbor (KNN) dengan membandingkan tiga fungsi jarak, yaitu Euclidean, Manhattan, dan Minkowski. Dataset yang digunakan berasal dari Kaggle sebanyak 18.426 komentar setelah proses pembersihan data, dengan dua kelas sentimen yaitu positif (komentar judi online) dan negatif (komentar non-judol). Representasi teks dilakukan menggunakan TF-IDF dengan maksimum 1500 fitur, serta penanganan ketidakseimbangan data menggunakan SMOTE. Eksperimen dilakukan terhadap 150 kombinasi parameter yang melibatkan variasi fungsi jarak, nilai K (3, 5, 7, 9, 11), data split, dan penerapan SMOTE. Hasil penelitian menunjukkan bahwa konfigurasi terbaik diperoleh pada Manhattan distance dengan K = 3, data split 90:10, dan SMOTE, yang menghasilkan F1-score sebesar 96,31%. Selain itu, seluruh fungsi jarak menunjukkan pola konsisten di mana performa menurun seiring meningkatnya nilai K. Manhattan distance terbukti paling sensitif terhadap perubahan nilai K, sedangkan Euclidean menunjukkan kestabilan performa, dan Minkowski memberikan kompromi antara keduanya. Temuan ini menunjukkan bahwa pemilihan fungsi jarak dan nilai K memiliki pengaruh signifikan terhadap performa KNN dalam klasifikasi sentimen komentar judi online.
Copyrights © 2026