Panjaitan, Intan Juliana
Unknown Affiliation

Published : 2 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 2 Documents
Search

The Implementation of the Fuzzy C-Means Method in Handling Outlier Data in the 2021 Village Potential Data of Bengkulu Province Panjaitan, Intan Juliana; Indahwati, Indahwati; Afendi, Farit Mochamad
ComTech: Computer, Mathematics and Engineering Applications Vol. 16 No. 1 (2025): ComTech
Publisher : Bina Nusantara University

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.21512/comtech.v16i1.12274

Abstract

Clustering groups aims to ensure similarity within clusters and disparity between them. The research evaluated the Fuzzy C-Means method’s effectiveness in clustering large datasets containing outliers, focusing on the 2021 Village Potential data from Bengkulu Province. The dataset, comprising 1,514 observations from villages and urban villages, provided a comprehensive resource for understanding regional development. Outliers, a common challenge in cluster analysis, were detected using univariate and multivariate methods, revealing substantial variability. PCA was applied, improving clustering quality to address multicollinearity among variables. In the results, the fuzzifier (w) parameter in the FCM method plays a crucial role in controlling the degree of membership for data points in clusters, which can potentially reduce the impact of outliers, enhancing clustering robustness and accuracy. The FCM method effectively produces clusters with high intra-cluster homogeneity and inter-cluster heterogeneity. Using the Elbow method, three optimal clusters are identified. Cluster 1, dominated by villages in Bengkulu City, is the most advanced, with superior infrastructure and services, but the fewest villages business units, necessitating economic empowerment. Cluster 2, comprising villages in North Bengkulu Regency, demonstrates moderate development but suffers from poor transportation access, requiring improvements to support socio-economic activities. Cluster 3, dominated by villages in Kaur Regency, is the least developed, with limited basic services and infrastructure, highlighting the need for substantial investments in governance and essential services. These findings provide actionable insights for village development in Bengkulu Province, supporting targeted policies tailored to each cluster’s unique characteristics.
Evaluasi Kinerja Metode CLARA dan FCM dalam Analisis Gerombol untuk Data Berjumlah Besar dengan Pencilan Indahwati, Indahwati; Panjaitan, Intan Juliana; Afendi , Farit Mochamad
Limits: Journal of Mathematics and Its Applications Vol. 22 No. 3 (2025): Limits: Journal of Mathematics and Its Applications Volume 22 Nomor 3 Edisi No
Publisher : Pusat Publikasi Ilmiah LPPM Institut Teknologi Sepuluh Nopember

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Analisis gerombol adalah suatu metode statistika yang mengidentifikasi gerombol objek berdasarkan karakteristik serupa. Masalah yang sering terjadi dalam analisis gerombol adalah keberadaan data pencilan. Keberadaan pencilan dapat mengakibatkan output yang tidak sesuai dengan gambaran yang sebenarnya, sehingga gerombol yang dihasilkan tidak merepresentasikan objek dengan tepat. Masalah lain yang dapat muncul dalam analisis gerombol adalah besarnya jumlah amatan, sehingga diperlukan metode analisis yang efisien dalam penggerombolan. Penelitian ini juga memperdalam tentang kinerja keduanya terhadap jarak antara pusat gerombol dan kondisi penggerombolan melalui kajian simulasi, dimana masing-masing faktor terdiri dari tiga level yang diobservasi. Metode Clustering Large Applications (CLARA) dan Fuzzy C-Means (FCM) adalah metode yang kekar (robust) terhadap pencilan dan mampu menganalisis dataset besar.  Metode FCM menggunakan nilai pembobot (w) yang optimal agar kekar terhadap pencilan. Metode CLARA memiliki sifat kekar dikarenakan menggunakan medoid sebagai pusat gerombol dan penggunaan jarak Manhattan dalam perhitungan jarak antara objek dan pusat gerombol. Metode tersebut akan dievaluasi menggunakan beberapa kriteria evaluasi kebaikan yaitu berdasarkan akurasi penggerombolan serta rasio simpangan baku dalam gerombol dan antar gerombol. Hasil analisis menunjukkan pengaruh signifikan pada masing-masing faktor dan interaksi antar faktor. Visualisasi menunjukkan bahwa peningkatan persentase pencilan mengurangi akurasi penggerombolan, sementara jumlah data yang lebih besar meningkatkan akurasi. Jarak yang lebih besar antara pusat gerombol dan kondisi gerombol yang terpisah menghasilkan rasio simpangan baku gerombol yang lebih kecil. Hasil penelitian menunjukkan bahwa metode FCM lebih efektif dalam menangani data dengan variasi yang signifikan.