Kesehatan karyawan merupakan faktor krusial dalam produktivitas organisasi. Penelitian ini mengimplementasikan pendekatan hybrid data mining yang menggabungkan algoritma K-Means Clustering dan Random Forest untuk memprediksi status kesehatan karyawan berdasarkan data aktivitas fisik harian. Dataset yang digunakan terdiri dari 5.000 record data karyawan dengan 12 atribut meliputi informasi demografis, data temporal, dan jumlah langkah harian. Metodologi penelitian menggunakan Orange 3 dengan workflow terintegrasi untuk analisis clustering dan klasifikasi. Hasil analisis K-Means clustering berhasil mengidentifikasi 4 cluster karyawan yang distinct berdasarkan pola aktivitas fisik: Cluster 1 (4.323 langkah/hari), Cluster 2 (3.478 langkah/hari), Cluster 3 (9.702 langkah/hari), dan Cluster 4 (4.550 langkah/hari) dengan silhouette score 0,5 yang menunjukkan kualitas clustering yang sedang dengan adanya beberapa tumpang tindih antar cluster. Model Random Forest menunjukkan performa superior dengan akurasi 96,4%, AUC 0,994, F1-score 0,964, precision 96,4%, recall 96,4%, dan MCC 0,934, mengungguli Naive Bayes pada semua metrik evaluasi. Integrasi kedua algoritma menghasilkan framework komprehensif yang mampu mendeskripsikan pola existing, memprediksi status kesehatan dimasa depan, dan memberikan rekomendasi intervensi spesifik per segment karyawan. Penelitian ini memberikan kontribusi praktis berupa sistem prediktif yang cost-effective untuk corporate wellness programs dan kontribusi teoritis dalam validasi efektivitas algoritma ensemble pada domain kesehatan occupational.
Copyrights © 2025