Claim Missing Document
Check
Articles

Found 1 Documents
Search

Klasterisasi Berita Berbahasa Indonesia Menggunakan Model K-Means Dan Indobert Untuk Menentukan Berita Hoaks Kholis Amwari; Totok Chmaidy; Suhartono

Publisher : Program Studi Teknik Informatika, Fakultas Teknik, Universitas Yudharta Pasuruan

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.35891/explorit.v17i1.6502

Abstract

Penyebaran berita hoaks di media digital, khususnya dalam konteks politik, semakin marak dan berdampak negatif terhadap persepsi publik serta stabilitas sosial. Penelitian ini bertujuan untuk menganalisis dan mengelompokkan berita politik berbahasa Indonesia menggunakan model IndoBERT sebagai representasi teks dan algoritma K-Means Clustering sebagai metode klasterisasi, guna membedakan berita hoaks dan fakta. IndoBERT digunakan untuk menghasilkan vektor representasi kata berbasis konteks yang lebih akurat dibanding metode konvensional seperti TF-IDF dan Word2Vec Vektor ini kemudian dikelompokkan menggunakan K-Means Clustering untuk membentuk klaster berdasarkan kemiripan semantik.Hasil penelitian menunjukkan bahwa pendekatan ini berhasil memisahkan berita ke dalam dua klaster utama, yaitu hoaks dan fakta, dengan hasil evaluasi kuantitatif berupa nilai Silhouette Score sebesar 0,21. Validasi manual terhadap 200 sampel berita menunjukkan bahwa klaster yang terbentuk memiliki tingkat akurasi klasifikasi sebesar 88% untuk berita fakta dan 82% untuk berita hoaks. Temuan ini membuktikan bahwa kombinasi IndoBERT dan K-Means Clustering efektif digunakan sebagai alat bantu dalam identifikasi berita hoaks secara otomatis dan unsupervised. Penelitian ini juga merekomendasikan penggunaan dataset yang lebih luas dan penggabungan dengan pendekatan supervised untuk hasil yang lebih optimal.