Claim Missing Document
Check
Articles

Found 12 Documents
Search

CLUSTERING ROTATIONAL CHURN OF TELECOMMUNICATIONS CUSTOMERS USING A DATA-CENTRICAI APPROACH Muttaqin, Widang; Lydia, Maya Silvi; Fahmi, Fahmi
JURTEKSI (Jurnal Teknologi dan Sistem Informasi) Vol 10, No 4 (2024): September 2024
Publisher : STMIK Royal

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.33330/jurteksi.v10i4.3304

Abstract

Abstract: In the current era of very fast technological development, customer churn is a serious challenge, especially in the competitive telecommunications industry. Churn refers to customers who stop using a service or move to another provider, and can be categorized into three types: Active Churn, Passive Churn, and Rotational Churn. Rotational Churn, which is difficult to predict be- cause the reasons for stopping are unclear, is the main focus of this research. This research aims to group Rotational Churn customers using a Data-Centric AI approach. This approach emphasizes improving data quality through Confident Learning and Synthetic Data before being applied to the K-Means clustering algorithm. The data used in this research is customer churn data from one telecommunications company during 2023. The research results show that customer grouping using the K-Means algorithm can provide deep insight into the characteristics of customer churn. The application of Data-Centric AI is proven to be able to increase the accuracy of clustering models, which ultimately helps compa- nies optimize programs and services to minimize churn and retain customers.       Keywords: data-centric AI; clustering; K-means  Abstrak: Dalam era perkembangan teknologi yang sangat pesat saat ini, churn pelanggan menjadi tantangan serius, terutama dalam industri telekomunikasi yang sangat kompetitif. Churn mengacu pada pelanggan yang berhenti menggunakan layanan atau beralih ke penyedia lain, dan dapat dikategorikan menjadi tiga jenis: Churn Aktif, Churn Pasif, dan Churn Rotasional. Churn Rotasional, yang sulit diprediksi karena alasan penghentian layanan tidak jelas, menjadi fokus utama penelitian ini. Penelitian ini bertujuan untuk mengelompokkan pelanggan Churn Rotasional menggunakan pendekatan Data-Centric AI. Pendekatan ini menekankan pada peningkatan kualitas data melalui Confident Learning dan Synthetic Data sebelum diterapkan ke algoritma K-Means clustering. Data yang digunakan dalam penelitian ini adalah data churn pelanggan dari satu perusahaan telekomunikasi selama tahun 2023. Hasil penelitian menunjukkan bahwa pengelompokan pelanggan menggunakan algoritma K-Means dapat memberikan wawasan mendalam tentang karakteristik churn pelanggan. Penerapan Data-Centric AI terbukti mampu meningkatkan akurasi model klastering, yang pada akhirnya membantu perusahaan mengoptimalkan program dan layanan untuk meminimalkan churn serta mempertahankan pelanggan. Kata kunci: data-Centric AI; klasterisasi; K-means 
Analisis Random Forest Menggunakan Principal Component Analysis Pada Data Berdimensi Tinggi Diba, Farah; Lydia, Maya Silvi; Sihombing, Poltak
The Indonesian Journal of Computer Science Vol. 12 No. 4 (2023): The Indonesian Journal of Computer Science (IJCS)
Publisher : AI Society & STMIK Indonesia

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.33022/ijcs.v12i4.3329

Abstract

Data yang memiliki dimensi tinggi membutuhkan metode machine learning yang mampu bekerja lebih cepat dan efektif dalam proses klasifikasi. Salah satu algoritma yang mampu menangani data kompleks adalah Random Forest. Random Forest bekerja dengan membangun beberapa decision tree secara random sebagai acuan feature selection. Namun, data berdimensi tinggi membutuhkan ruang penyimpanan yang lebih besar sehingga mengakibatkan lamanya proses komputasi. Oleh karena itu, Principal Component Analysis merupakan salah satu metode reduksi dimensi dalam merepresentasikan data berdimensi tinggi. PCA akan membentuk beberapa Principal Component yang mengandung informasi penting dari data asli. Dataset yang digunakan pada penelitian ini bersumber dari kaggle repository terdiri atas 26 atribut dan 129880 intances. Hasil dari penelitian ini RF dengan dengan n_estimators = 7 setelah direduksi PCA memiliki akurasi terbaik yaitu 90,13% pada data water quality.. Hal ini membuktikan bahwa PCA mampu mereduksi dimensi dengan membentuk pohon n_estimators sebanyak 7.