Claim Missing Document
Check
Articles

Found 1 Documents
Search

Klasifikasi Tingkat Ketidakhadiran Pegawai Menggunakan Random Forest, K-Nearest Neighbor, dan Logistic Regression Warih Angkasa, Julius; Ananda Konik Purbaningrum , Wahyu
Jurnal Multidisiplin Indonesia Vol. 5 No. 4 (2026): (2026): Jurnal Multidisiplin Indonesia
Publisher : Riviera Publishing

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.58344/jmi.v5i4.2687

Abstract

Ketidakhadiran pegawai merupakan salah satu faktor yang memengaruhi produktivitas organisasi, kualitas layanan, dan efisiensi pengelolaan sumber daya manusia. Data absensi yang tersedia pada banyak organisasi umumnya masih dimanfaatkan untuk pelaporan administratif, padahal data tersebut berpotensi digunakan untuk analisis prediktif. Penelitian ini bertujuan membangun model klasifikasi tingkat ketidakhadiran pegawai menggunakan pendekatan machine learning. Dataset penelitian menggunakan data Absenteeism at Work yang ditransformasi menjadi dua kelas, yaitu ketidakhadiran rendah dan ketidakhadiran tinggi dengan ambang lebih dari 8 jam sebagai kelas positif. Tahapan penelitian meliputi pembersihan data, transformasi label, encoding variabel kategorikal, standardisasi data pada model tertentu, penyeimbangan kelas menggunakan SMOTE, serta pengujian model menggunakan Random Forest, K-Nearest Neighbor, dan Logistic Regression. Evaluasi dilakukan menggunakan stratified 10-fold cross-validation dengan metrik accuracy, precision, recall, F1-score, dan AUC. Hasil pengujian menunjukkan bahwa Random Forest memperoleh accuracy tertinggi sebesar 89,9%, sedangkan Logistic Regression memberikan performa paling seimbang dengan precision 28,8%, recall 65,5%, F1-score 39,4%, dan AUC 81,4%. Temuan ini menunjukkan bahwa pemilihan model pada data ketidakhadiran pegawai tidak cukup didasarkan pada accuracy saja, tetapi perlu mempertimbangkan kemampuan model dalam mendeteksi kelas minoritas.