Penyakit ginjal kronis (Chronic Kidney Disease / CKD) merupakan penyakit degeneratif yang memerlukan deteksi dini agar penanganan dapat dilakukan secara lebih efektif. Penelitian ini bertujuan untuk mengembangkan model prediksi CKD menggunakan algoritma Random Forest dengan memanfaatkan dataset publik dari Kaggle yang terdiri dari 400 sampel dan 25 atribut klinis. Tahapan penelitian meliputi preprocessing data, yang mencakup penanganan nilai hilang melalui imputasi, pengodean variabel kategorik menggunakan Label Encoding, serta standardisasi fitur numerik untuk mendukung kestabilan proses pemodelan. Model dilatih dan diuji menggunakan pembagian data sebesar 80:20. Hasil evaluasi menunjukkan bahwa model Random Forest menghasilkan kinerja klasifikasi yang sangat tinggi pada dataset penelitian, dengan nilai akurasi, precision, recall, F1-score, dan AUC yang mencapai nilai maksimum. Meskipun demikian, capaian kinerja tersebut perlu diinterpretasikan secara hati-hati karena ukuran dataset relatif kecil dan berpotensi menimbulkan overfitting, sehingga belum sepenuhnya mencerminkan kinerja model pada kondisi klinis nyata. Sebagai kontribusi ilmiah, penelitian ini menyajikan penerapan Random Forest dengan preprocessing yang terstruktur dan evaluasi multi-metrik untuk prediksi CKD, yang menunjukkan potensi penggunaan machine learning sebagai alat bantu skrining awal berbasis data klinis. Penelitian lanjutan disarankan untuk menerapkan teknik validasi silang serta menggunakan dataset yang lebih besar dan beragam guna meningkatkan kemampuan generalisasi model.
Copyrights © 2026