Abstrak— Obesitas merupakan salah satu permasalahan kesehatan yang berkaitan erat dengan pola hidup modern. Tujuan dari penelitian ini adalah untuk mengevaluasi dan membandingkan kinerja algoritma Naïve Bayes dan Random Forest dalam mengelompokkan tingkat obesitas berdasarkan pola gaya hidup. Dataset diperoleh dari platform Kaggle yang memuat berbagai atribut terkait kebiasaan hidup, seperti pola makan dan aktivitas fisik. Penelitian dimulai dengan tahapan data preprocessing meliputi penghapusan atribut yang tidak relevan, transformasi label kelas menjadi bentuk kategorikal, serta pembersihan data kosong. Data kemudian dibagi menjadi data latih dan data uji. Model klasifikasi dibangun menggunakan aplikasi RapidMiner dengan algoritma Naïve Bayes dan Random Forest. Evaluasi dilakukan menggunakan metrik akurasi, presisi, recall, dan classification error. Berdasarkan hasil pengujian, algoritma Random Forest menghasilkan akurasi 83,23%, precision 83,93%, dan recall 82,46% pada kelas Obesity, dengan classification error sebesar 16,77%. Sementara itu, Naïve Bayes mencatat akurasi 76,09%, precision 73,21% dan recall 71,93% pada kelas Obesity, sementara itu, hasil classification error sebesar 23,91%. Hasil analisis dari Weight by Information Gain menunjukkan bahwa atribut dengan bobot tertinggi adalah usia (0,290), diikuti frekuensi konsumsi sayuran (0,272) dan jumlah makan utama per hari (0,232) yang berperan penting dalam klasifikasi obesitas. Penelitian ini menyimpulkan bahwa algoritma Random Forest lebih unggul dibandingkan Naïve Bayes dalam memprediksi obesitas berdasarkan faktor gaya hidup dan faktor lainnya yang dapat memicu obesitas. Kata Kunci— Obesitas, Gaya Hidup, Naive Bayes, Random Forest, Rapidminer.
Copyrights © 2025