Abstrak - Kemiskinan merupakan permasalahan utama yang masih dihadapi oleh negara berkembang, termasuk Indonesia. Ketepatan dalam mengidentifikasi penduduk miskin sangat penting agar program bantuan sosial dapat disalurkan secara efektif dan tepat sasaran. Penelitian ini bertujuan untuk membangun model hibrida yang menggabungkan algoritma K-Means dan Decision Tree dalam menentukan status kemiskinan penduduk Indonesia berdasarkan data sosial-ekonomi. Data yang digunakan diambil dari platform Kaggle, terdiri dari 514 data penduduk dengan 13 atribut. Algoritma K-Means digunakan untuk mengelompokkan data ke dalam klaster berdasarkan kemiripan karakteristik, dengan evaluasi menggunakan Davies Bouldin Index (DBI). Selanjutnya, hasil klaster digunakan sebagai label dalam proses klasifikasi menggunakan algoritma Decision Tree, yang dievaluasi menggunakan Confusion Matrix. Hasil penelitian menunjukkan bahwa model Decision Tree mencapai akurasi 98,44%, dengan precision sebesar 95% dan recall sebesar 91,94%, sedangkan model K-Means menunjukkan klaster optimal pada k = 2 atau 3 berdasarkan grafik elbow. Model hibrida ini terbukti mampu meningkatkan akurasi klasifikasi dan memberikan aturan pengambilan keputusan yang lebih jelas dan mudah diinterpretasikan. Dengan demikian, model ini dapat digunakan sebagai alat bantu dalam mendukung kebijakan pemerintah untuk penanggulangan kemiskinan secara lebih efektif dan berbasis data.Kata kunci: Kemiskinan; Data Mining; K-Means; Decision Tree; Klasterisasi; Klasifikasi; Model Hibrida. Abstract - Poverty remains a major issue faced by developing countries, including Indonesia. Accurate identification of impoverished populations is crucial to ensure that social assistance programs are delivered effectively and to the right recipients. This study aims to develop a hybrid model that integrates the K-Means clustering algorithm and the Decision Tree classification algorithm to determine the poverty status of Indonesian citizens based on socio-economic data. The dataset used was sourced from Kaggle and consists of 514 records with 13 attributes. The K-Means algorithm is employed to group the data into clusters based on similarity in characteristics, with evaluation performed using the Davies Bouldin Index (DBI). The resulting clusters are then used as labels for classification using the Decision Tree algorithm, which is evaluated using a Confusion Matrix. The results show that the Decision Tree model achieved an accuracy of 98.44%, with a precision of 95% and recall of 91.94%, while the K-Means model indicated optimal clustering at k = 2 or 3 based on the elbow method. This hybrid model has proven effective in improving classification accuracy and generating decision rules that are clear and interpretable. Therefore, the model can serve as a valuable decision support tool for government policy-makers in the fight against poverty through data-driven approaches.Keywords: Poverty; Data Mining; K-Means; Decision Tree; Clustering; Classification; Hybrid Model.
Copyrights © 2025