Hidayati Ramadhani, Novia
Unknown Affiliation

Published : 1 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 1 Documents
Search

ANALISIS PENGGUNAAN METODE UNDERSAMPLING CLUSTER CENTROIDS UNTUK MODEL KLASIFIKASI SVM DAN EKSTRAKSI FITUR BOW PADA ULASAN APLIKASI SIREKAP 2024 Hidayati Ramadhani, Novia; Azmi Verdikha, Naufal; Azhima Yoga Siswa, Taghfirul
JATI (Jurnal Mahasiswa Teknik Informatika) Vol. 9 No. 3 (2025): JATI Vol. 9 No. 3
Publisher : Institut Teknologi Nasional Malang

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.36040/jati.v9i3.13536

Abstract

Sistem Informasi Rekapitulasi (SIREKAP) digunakan sebagai aplikasi perhitungan suara pemilu. Namun, pada awal bulan februari 2024 aplikasi ini mendapat banyak ulasan negatif di platform google play store, dengan rata-rata peringkat 2,7 dari 5. Hal ini menunjukkan adanya ketidakseimbangan pada peringkat ulasan pengguna. Ketidakseimbangan ini dapat mempengaruhi hasil analisis dan evaluasi aplikasi secara keseluruhan. Untuk mengatasi ketidakseimbangan data pada ulasan penelitian in menggunakan algoritma machine learning. Penelitian ini bertujuan untuk mengklasifikasikan teks ulasan aplikasi SIREKAP 2024 menggunakan algoritma SVM dengan ekstraksi fitur BoW serta metode undersampling Cluster Centroids (CC) untuk menangani ketidakseimbangan data. Dataset yang digunakan berjumlah 8235 ulasan. Proses validasi dilakukan menggunakan teknik k-fold cross-validation dengan k=10 untuk memastikan performa secara konsisten pada berbagai subset data. Hasil penelitian menunjukkan bahwa undersampling CC efektif dalam menyeimbangkan distribusi kelas, dengan Imbalanced Ratio (IR) awal sebesar 21,02 berhasil menjadi 1. Selain itu nilai entropi meningkat dari 1,079 menjadi 1,609 yang menunjukkan peningkatan keragaman ketidakpastian data. Namun, meskipun distribusi kelas menjadi seimbang, rata rata nilai IBA mengalami penurunan dari 0,274 pada Skenario I menjadi 0,271 pada Skenario II. Penurunan ini mengindikasikan bahwa teknik CC dapat menyebabkan hilangnya informasi penting pada kelas mayoritas selama proses undersampling.