Jurnal Matematika UNAND
Vol. 12 No. 2 (2023)

PERFORMA KLASIFIKASI DATA TIDAK SEIMBANG DENGAN PENDEKATAN MACHINE LEARNING (STUDI KASUS: DIABETES INDIAN PIMA)

Aqsha, Masjidil (Unknown)
Sunusi, Nurtiti (Unknown)



Article Info

Publish Date
03 Feb 2024

Abstract

Diabetes merupakan suatu penyakit atau gangguan metabolisme kronis dengan multi etiologi yang ditandai dengan tingginya kadar gula darah disertai dengan gangguan metabolisme karbohidrat, lipid, dan protein sebagai akibat insufisiensi fungsi insulin. Faktor risiko diabetes berhubungan dengan status diabetes sesorang. Berbagai pendekatan machine learning menjadi alternatif dalam memprediksi status diabetes. Namun, dalam banyak kasus, data yang tersedia tidak cukup seimbang dalam kelas datanya. Adanya ketidakseimbangan data dapat menyebabkan hasil prediksi menjadi tidak akurat. Tujuan penelitian dalam paper ini adalah untuk mengatasi masalah ketidakseimbangan data dan membandingkan kinerja model dalam memprediksi status diabetes. Secara umum, metode seperti Synthetic Minority Over-sampling Technique (SMOTE) dan Adaptive Synthetic (ADASYN) dapat digunakan untuk menyeimbangkan data. Data Diabetes Indian Pima yang telah diseimbangkan kemudian diprediksi dengan metode machine learning seperti metode Bagging, Random Forest, dan XGBoost. Hasil penelitian menunjukkan bahwa performa model machine learning meningkat setelah menangani ketidakseimbangan data dan model terbaik adalah model XGBoost. 

Copyrights © 2023






Journal Info

Abbrev

jmua

Publisher

Subject

Computer Science & IT Mathematics

Description

Fokus dan Lingkup dari Jurnal Matematika FMIPA Unand meliputi topik-topik dalam Matematika sebagai berikut : Analisis dan Geometri Aljabar Matematika Terapan Matematika Kombinatorika Statistika dan Teori ...