Sains, Aplikasi, Komputasi dan Teknologi Informasi
Vol 4, No 2 (2022): Sains, Aplikasi, Komputasi dan Teknologi Informasi

Kajian Penerapan Jarak Euclidean, Manhattan, Minkowski, dan Chebyshev pada Algoritma Clustering K-Prototype

Rani Nooraeni (Politeknik Statistika STIS)
Ghita Nurfalah (Politeknik Statistika STIS)



Article Info

Publish Date
09 Jan 2023

Abstract

Clustering merupakan teknik data mining yang bertujuan mengelompokkan data yang memiliki kemiripan kedalam satu klaster, semakin tinggi tingkat kemiripan dalam satu klaster semakin baik hasil clustering yang dihasilkan. Kemiripan data tersebut diukur menggunakan fungsi jarak, sehingga memilih fungsi jarak yang tepat sangatlah penting dalam clustering. K-Prototype (KP) adalah algoritma clustering untuk data campuran yang telah banyak digunkan, pengembangan algoritma lainnya dari K-Prototype yang terkenal adalah Fuzzy K-Prototype (FKP) dan Genetic Algorithm K-Prototype (GAFKP). Namun ketiga algoritma tersebut hanya menggunakan jarak Euclidean dalam mengukur kesamaan datanya. Oleh karena itu, dalam penelitian ini dilakukan penerapan jarak Euclidean, Manhattan, Minkowski, dan Chebyshev pada ketiga algoritma tersebut untuk memperoleh kombinasi jarak dan algoritma yang memberikan hasil clustering yang lebih baik. Hasil penelitian menunjukkan bahwa diantara seluruh kombinasi jarak dan algoritma clustering, algoritma Fuzzy K-Prototype dengan jarak Euclidean memberikan hasil yang lebih baik berdasarkan metode evaluasi akurasi dan indeks CV

Copyrights © 2022






Journal Info

Abbrev

jsakti

Publisher

Subject

Aerospace Engineering Computer Science & IT

Description

SAINS, APLIKASI, KOMPUTASI DAN TEKNOLOGI INFORMASI is a peer-reviewed journal which is published by Faculty of Computer Sience and Information Technology, Universitas Mulawarman, East Kalimantan publishes biannually in April and August. This Journal publishes current original research on Computer ...