JAR'S (Journal of Advanced Research in Informatics)
Vol 4 No 1 (2025): Journal of Advanced Research in Informatics

IMPLEMENTASI DATA MINING MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING DAN RANDOM FOREST UNTUK PREDIKSI STATUS KESEHATAN KARYAWAN

ridwan, ridwan (Unknown)



Article Info

Publish Date
05 Dec 2025

Abstract

Kesehatan karyawan merupakan faktor krusial dalam produktivitas organisasi. Penelitian ini mengimplementasikan pendekatan hybrid data mining yang menggabungkan algoritma K-Means Clustering dan Random Forest untuk memprediksi status kesehatan karyawan berdasarkan data aktivitas fisik harian. Dataset yang digunakan terdiri dari 5.000 record data karyawan dengan 12 atribut meliputi informasi demografis, data temporal, dan jumlah langkah harian. Metodologi penelitian menggunakan Orange 3 dengan workflow terintegrasi untuk analisis clustering dan klasifikasi. Hasil analisis K-Means clustering berhasil mengidentifikasi 4 cluster karyawan yang distinct berdasarkan pola aktivitas fisik: Cluster 1 (4.323 langkah/hari), Cluster 2 (3.478 langkah/hari), Cluster 3 (9.702 langkah/hari), dan Cluster 4 (4.550 langkah/hari) dengan silhouette score 0,5 yang menunjukkan kualitas clustering yang sedang dengan adanya beberapa tumpang tindih antar cluster. Model Random Forest menunjukkan performa superior dengan akurasi 96,4%, AUC 0,994, F1-score 0,964, precision 96,4%, recall 96,4%, dan MCC 0,934, mengungguli Naive Bayes pada semua metrik evaluasi. Integrasi kedua algoritma menghasilkan framework komprehensif yang mampu mendeskripsikan pola existing, memprediksi status kesehatan dimasa depan, dan memberikan rekomendasi intervensi spesifik per segment karyawan. Penelitian ini memberikan kontribusi praktis berupa sistem prediktif yang cost-effective untuk corporate wellness programs dan kontribusi teoritis dalam validasi efektivitas algoritma ensemble pada domain kesehatan occupational.

Copyrights © 2025






Journal Info

Abbrev

JARS

Publisher

Subject

Computer Science & IT

Description

Sistem Informasi Sistem Pakar Sistem Pendukung Keputusan Data Mining Artificial Intelligence System Machine Learning Big ...