Tujuan dari penelitian ini membahas analisis data klinis untuk mengidentifikasi risiko penyakit jantung menggunakan metode unsupervised learning. Metode yang digunakan adalah Principal Component Analysis (PCA) untuk reduksi dimensi data numerik, dan K-Medoids Clustering untuk mengelompokkan pasien berdasarkan kemiripan atribut klinis. Dataset heart.csv yang digunakan mencakup variabel numerik dan kategorikal, seperti tekanan darah, kolesterol, jenis kelamin, dan hasil EKG. Outlier dideteksi menggunakan Mahalanobis Distance, kemudian dilakukan clustering pada variabel kontinu dengan PCA dan jarak Euclidean, serta pada variabel diskrit dengan jarak Hamming dan visualisasi t-SNE. Hasil clustering menunjukkan adanya kelompok pasien dengan karakteristik klinis serupa yang mencerminkan tingkat risiko penyakit jantung yang berbeda. Kombinasi PCA dan K-Medoids terbukti efektif untuk mengungkap pola risiko secara visual dan sistematis, sehingga berpotensi mendukung pengambilan keputusan klinis
Copyrights © 2025