Penyakit hati merupakan masalah kesehatan global yang semakin diperburuk oleh gaya hidup tidak sehat, seperti konsumsi alkohol yang berlebihan dan deteksi dini yang tidak memadai. Oleh karena itu, pendekatan berbasis teknologi diperlukan untuk meningkatkan akurasi diagnosis. Penelitian ini bertujuan untuk membandingkan kinerja metode pembelajaran mesin Random Forest dan K-Nearest Neighbor dalam mengklasifikasikan penyakit hati berdasarkan faktor klinis dan gaya hidup pasien. Data diperoleh dengan menggabungkan dua dataset terbuka, yang totalnya berjumlah 2.283 entri dan 19 fitur, termasuk parameter laboratorium, usia, konsumsi alkohol, dan riwayat kesehatan. Tahapan penelitian meliputi pra-pemrosesan data, termasuk imputasi nilai yang hilang, pengkodean variabel kategorikal, normalisasi fitur numerik, rekayasa fitur, dan penyeimbangan kelas menggunakan Teknik Oversampling Minoritas Sintetis. Dataset kemudian dibagi menjadi 80% data pelatihan dan 20% data pengujian secara stratifikasi. Evaluasi model dilakukan menggunakan matriks kebingungan, akurasi, presisi, recall, F1-score, dan Area Di Bawah Kurva Receiver Operating Characteristic. Hasil menunjukkan bahwa Random Forest memiliki kinerja lebih baik dengan akurasi 82% dan nilai Area Di Bawah Kurva 0,91, dibandingkan dengan K-Nearest Neighbor yang mencapai akurasi 72% dan Area Di Bawah Kurva 0,83. Selain itu, Random Forest menghasilkan jumlah negatif palsu yang lebih rendah, menjadikannya lebih dapat diandalkan dalam mendeteksi pasien dengan penyakit hati. Oleh karena itu, Random Forest direkomendasikan sebagai metode yang lebih efektif dan stabil untuk sistem deteksi dini penyakit hati berbasis pembelajaran mesin. Kata kunci: Penyakit Hati, Klasifikasi Medis, Random Forest, K-Nearest Neighbor, Deteksi Dini
Copyrights © 2026