Churn merupakan kondisi ketika pelanggan menghentikan penggunaan produk atau layanan suatu perusahaan, yang secara langsung berdampak terhadap penurunan pendapatan dan peningkatan biaya akuisisi pelanggan baru. Ketidakmampuan model pembelajaran mesin dalam mengenali pelanggan yang berisiko churn akibat ketidakseimbangan data menjadi tantangan utama dalam sistem prediksi churn. Penelitian ini bertujuan untuk mengembangkan model prediksi churn yang lebih akurat dan sensitif dengan mengombinasikan algoritma Support Vector Machine (SVM) dan metode ensemble (Bagging dan Stacking), disertai penerapan teknik hybrid sampling seperti SMOTE. Metode penelitian meliputi pengumpulan data, preprocessing data, pembagian data, pelatihan model dan evaluasi . Hasil penelitian menunjukkan bahwa model Stacking memberikan performa terbaik dengan akurasi dan F1-score mencapai 86%, serta nilai AUC sebesar 0,93. Fitur products number, age, dan active member teridentifikasi sebagai variabel paling berpengaruh terhadap churn. Batasan utama penelitian ini terletak pada keterbatasan sumber data dan belum dilakukannya tuning parameter secara mendalam. Penelitian ini juga memberikan kontribusi praktis bagi strategi retensi pelanggan dan dapat dikembangkan lebih lanjut dengan validasi pada dataset lintas industri dan tuning parameter yang lebih luas.
Copyrights © 2025