Jutisi: Jurnal Ilmiah Teknik Informatika dan Sistem Informasi
Vol 15, No 2 (2026): April 2026

Deteksi Dini Diabetes Mellitus Tipe 2 Pada Usia Dewasa Muda Menggunakan Algoritma Decision Tree - C4.5

SOFIA DARFINDA DALIMAJUN (Institut Teknologi dan Bisnis Asia Malang)
Azwar Riza Habibi (Institut Teknologi dan Bisnis Asia Malang)



Article Info

Publish Date
14 May 2026

Abstract

The shift in the epidemiological pattern of metabolic diseases is indicated by the increasing incidence of Type 2 Diabetes Mellitus (T2DM) in young individuals. The increasing incidence of glucose metabolism disorders is largely due to changes in modern lifestyles, such as high calorie intake and lack of physical activity. Early detection during productive age is crucial to prevent long-term problems. Based on clinical data, this study created a model for early detection of type 2 diabetes using the Decision Tree C4.5 algorithm. The dataset was filtered for people aged between 20 and 40 years after being obtained from Kaggle. The study phase included data pre-processing, data splitting for testing and training, and model development using entropy and information gain. Accuracy, precision, recall, F1-score, and ROC-AUC were used to evaluate the model. The accuracy was 92.4% and the ROC-AUC was 0.938. The completed model can be used as a data-driven interpretive health screening tool.Keywords: Early diagnosis; Decision Tree algorithm; C4.5; Classification model AbstrakPergeseran pola epidemiologi penyakit metabolik ditunjukkan oleh meningkatnya kejadian Diabetes Melitus Tipe 2 (T2DM) pada individu muda. Meningkatnya kejadian gangguan metabolisme glukosa sebagian besar disebabkan oleh perubahan gaya hidup modern, seperti pola asupan kalori tinggi dan kurangnya aktivitas fisik. Deteksi dini pada usia produktif sangat penting untuk mencegah masalah jangka panjang. Berdasarkan data klinis, penelitian ini menciptakan model deteksi dini diabetes tipe 2 menggunakan algoritma Decision Tree C4.5. Dataset difilter untuk orang berusia antara 20 dan 40 tahun setelah diperoleh dari Kaggle. Fase studi meliputi pra-pemrosesan data, pemisahan data untuk pengujian dan pelatihan, serta pengembangan model menggunakan entropi dan perolehan informasi. Akurasi, presisi, recall, F1-score, dan ROC-AUC digunakan untuk menilai model tersebut. Akurasinya adalah 92,4% dan ROC-AUC adalah 0,938. Model yang telah selesai dapat digunakan sebagai alat skrining kesehatan interpretatif berbasis data. 

Copyrights © 2026






Journal Info

Abbrev

jutisi

Publisher

Subject

Computer Science & IT

Description

Jutisi: Jurnal Ilmiah Teknik Informatika dan Sistem Informasi adalah Jurnal Ilmiah bidang Teknik Informatika dan Sistem Informasi yang diterbitkan secara periodik tiga nomor dalam satu tahun, yaitu pada bulan April, Agustus dan Desember. Redaksi Jutisi: Jurnal Ilmiah Teknik Informatika dan Sistem ...