Garuda - Garba Rujukan Digital

Article Per Year (5 Year)

p-Index From 2021 - 2026

0.23

P-Index

This Author published in this journals

All Journal Jurnal Ilmu Komputer dan Informatika

Subuh, Arung Buana

Unknown Affiliation

Author-ID : 9993061

Computer Science & IT Electrical & Electronics Engineering Engineering Mathematics

Published : 1 Documents Claim Missing Document

Claim Missing Document

Articles

Evaluasi Performa Gaussian Mixture Model dan K-Means terhadap Ketidakseimbangan Data pada Clustering Yuri, Muhammad Farrel Evan; Pasaribu, Farzad Sahnadi; Subuh, Arung Buana; Naibaho, Muhammad Hafif; Piliang, Arnita
Jurnal Ilmu Komputer dan Informatika | E-ISSN : 3063-9026 Vol. 2 No. 4 (2026): April - Juni
Publisher : GLOBAL SCIENTS PUBLISHER

Show Abstract | Download Original | Original Source | Check in Google Scholar

Data imbalance represents a primary challenge in clustering analysis, particularly in datasets with highly disproportionate class distributions such as the Credit Card Fraud Detection dataset from Kaggle. This study aims to evaluate and compare the performance of the Gaussian Mixture Model (GMM) and K-Means algorithms under such conditions through a systematic literature review of nine prior studies. Clustering quality is evaluated using three internal validation metrics: Silhouette Score, Davies-Bouldin Index (DBI), and Calinski-Harabasz Index (CHI). The findings indicate that GMM consistently produces more stable and flexible clusters in data with overlapping distributions, as its probabilistic approach through the Expectation-Maximization (EM) algorithm allows each data point to hold multiple cluster membership probabilities. In contrast, K-Means produces sharper cluster boundaries with lower computational complexity, yet remains sensitive to outliers and the spherical distribution assumption frequently unmet in imbalanced data. The dominance of the majority class risks distorting K-Means centroids, resulting in suboptimal detection of fraudulent transactions, whereas GMM proves more adaptive for this scenario despite its higher computational cost.

Co-Authors Naibaho, Muhammad Hafif Pasaribu, Farzad Sahnadi Piliang, Arnita Yuri, Muhammad Farrel Evan

Title

Found 1 Documents
Search

Abstract

Title Search

Found 1 Documents Search

Abstract

Title

Found 1 Documents
Search