Claim Missing Document
Check
Articles

Model Hybrid K-Means dan Decision Tree untuk Penentuan Status Kemiskinan Penduduk Indonesia Agustiena Merdekawati; Jefina Tri Kumalasari
Jurnal Nasional Komputasi dan Teknologi Informasi (JNKTI) Vol 8, No 3 (2025): Juni 2025
Publisher : Program Studi Teknik Komputer, Fakultas Teknik. Universitas Serambi Mekkah

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.32672/jnkti.v8i3.9214

Abstract

Abstrak - Kemiskinan merupakan permasalahan utama yang masih dihadapi oleh negara berkembang, termasuk Indonesia. Ketepatan dalam mengidentifikasi penduduk miskin sangat penting agar program bantuan sosial dapat disalurkan secara efektif dan tepat sasaran. Penelitian ini bertujuan untuk membangun model hibrida yang menggabungkan algoritma K-Means dan Decision Tree dalam menentukan status kemiskinan penduduk Indonesia berdasarkan data sosial-ekonomi. Data yang digunakan diambil dari platform Kaggle, terdiri dari 514 data penduduk dengan 13 atribut. Algoritma K-Means digunakan untuk mengelompokkan data ke dalam klaster berdasarkan kemiripan karakteristik, dengan evaluasi menggunakan Davies Bouldin Index (DBI). Selanjutnya, hasil klaster digunakan sebagai label dalam proses klasifikasi menggunakan algoritma Decision Tree, yang dievaluasi menggunakan Confusion Matrix. Hasil penelitian menunjukkan bahwa model Decision Tree mencapai akurasi 98,44%, dengan precision sebesar 95% dan recall sebesar 91,94%, sedangkan model K-Means menunjukkan klaster optimal pada k = 2 atau 3 berdasarkan grafik elbow. Model hibrida ini terbukti mampu meningkatkan akurasi klasifikasi dan memberikan aturan pengambilan keputusan yang lebih jelas dan mudah diinterpretasikan. Dengan demikian, model ini dapat digunakan sebagai alat bantu dalam mendukung kebijakan pemerintah untuk penanggulangan kemiskinan secara lebih efektif dan berbasis data.Kata kunci: Kemiskinan; Data Mining; K-Means; Decision Tree; Klasterisasi; Klasifikasi; Model Hibrida. Abstract - Poverty remains a major issue faced by developing countries, including Indonesia. Accurate identification of impoverished populations is crucial to ensure that social assistance programs are delivered effectively and to the right recipients. This study aims to develop a hybrid model that integrates the K-Means clustering algorithm and the Decision Tree classification algorithm to determine the poverty status of Indonesian citizens based on socio-economic data. The dataset used was sourced from Kaggle and consists of 514 records with 13 attributes. The K-Means algorithm is employed to group the data into clusters based on similarity in characteristics, with evaluation performed using the Davies Bouldin Index (DBI). The resulting clusters are then used as labels for classification using the Decision Tree algorithm, which is evaluated using a Confusion Matrix. The results show that the Decision Tree model achieved an accuracy of 98.44%, with a precision of 95% and recall of 91.94%, while the K-Means model indicated optimal clustering at k = 2 or 3 based on the elbow method. This hybrid model has proven effective in improving classification accuracy and generating decision rules that are clear and interpretable. Therefore, the model can serve as a valuable decision support tool for government policy-makers in the fight against poverty through data-driven approaches.Keywords: Poverty; Data Mining; K-Means; Decision Tree; Clustering; Classification; Hybrid Model.