Jurnal Nasional Teknologi Komputer
Vol 5 No 4 (2025): Oktober 2025

PREDIKSI STATUS PEROKOK DARI DATA TUBUH, HEMOGLOBIN, PENYAKIT GIGI MENGGUNAKAN RANDOM FOREST

Bella Rahmawati, Nayla (Unknown)
Permadi, Dimas (Unknown)
Fadly, Muhammad (Unknown)
Nur Yamin, Yamin (Unknown)
Priyatna , Ade (Unknown)



Article Info

Publish Date
05 Dec 2025

Abstract

Perilaku merokok merupakan masalah kesehatan masyarakat yang serius karena berkaitan dengan berbagai penyakit kronis seperti gangguan paru, penyakit kardiovaskular, dan masalah kesehatan mulut. Oleh karena itu, memprediksi status perokok menjadi penting untuk mendukung strategi pencegahan yang berbasis data akurat. Penelitian ini bertujuan untuk memprediksi status perokok menggunakan empat variabel utama, yaitu tinggi badan, berat badan, kadar hemoglobin, dan penyakit gigi. Algoritma Random Forest dipilih karena memiliki kinerja yang kuat dalam menangani tugas klasifikasi yang kompleks. Dataset yang digunakan dalam penelitian ini berasal dari survei kesehatan masyarakat yang mencakup informasi antropometri dan medis terkait kebiasaan merokok. Sebelum membangun model, data melalui beberapa tahap pra-pemrosesan seperti normalisasi, penghapusan nilai yang hilang, dan pembagian data menjadi set pelatihan dan pengujian dengan rasio 80:20. Metode Grid Search digunakan untuk mengoptimalkan parameter model. Hasil penelitian menunjukkan bahwa model Random Forest mencapai akurasi sebesar 87%, dengan precision sebesar 0.85 dan recall sebesar 0.88. Kadar hemoglobin dan penyakit gigi ditemukan sebagai prediktor paling penting dalam menentukan status perokok, sementara berat badan menunjukkan hubungan moderat yang mengindikasikan adanya kaitan antara metabolisme dan konsumsi nikotin. Temuan ini menunjukkan bahwa Random Forest memberikan performa klasifikasi yang kuat dan stabil dalam konteks kesehatan masyarakat. Selain itu, analisis data eksploratori dan pengembangan model dilakukan menggunakan Google Collaboratory dengan bahasa pemrograman Python. Evaluasi model akhir menghasilkan akurasi 80,16%, yang menegaskan efektivitas Random Forest dalam mengidentifikasi pola perilaku merokok dalam dataset.

Copyrights © 2025






Journal Info

Abbrev

jnastek

Publisher

Subject

Computer Science & IT

Description

Jurnal Nasional Teknologi Komputer di bidang ilmu komputer dan teknologi. Jurnal JNASTEK diterbitkan oleh CV. Hawari. Redaksi mengundang peneliti, praktisi, dan mahasiswa untuk menulis perkembangan ilmiah di bidang-bidang yang berkaitan dengan teknologi informasi, teknik informatika dan sistem ...