Emir Luthfi
Politeknik Statistika STIS

Published : 2 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 2 Documents
Search

Comparative Analysis of Hierarchical, K-Means, and K-Medoids Clustering and Methods in Grouping Indonesia's Human Development Index in 2019 Emir Luthfi; Arie Wahyu Wijayanto
INOVASI Vol 17, No 4 (2021): November
Publisher : Faculty of Economics and Business Mulawarman University

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.30872/jinv.v17i4.10106

Abstract

Dalam cabang ilmu data mining sudah banyak dilakukan analisis pengelompokan (clustering analysis) yang berguna untuk dapat mengelompokkan suatu data observasi tertentu. Pada penelitian digunakan dataset terkait Indeks Pembangunan Manusia (IPM) di Indonesia tahun 2019 dan dilakukan pengelompokkan variabel pembangun Indeks Pembangunan Manusia (IPM) yang terdiri dari angka harapan hidup, angka melek huruf, rata-rata lamanya sekolah, dan pengeluaran perkapita yang disesuaikan menggunakan metode Hirearchical, K-Means, dan K-Medoids Clustering. Metode Hirearchical yang digunakan yaitu dengan metode Algomerative menggunakan kemiripan jarak dengan Ward Method. Dari hasil ketiga metode tersebut akan dibandingkan untuk memperoleh metode yang terbaik dengan melihat ukuran validitas dari nilai Dunn Index (DN), Davies Bouldin Index (DB), Calinski-Harabasz Index (CH) serta untuk menentukan jumlah klaster/kelompok yang optimum dan yang terpenting dalam membandingkan untuk mendapatkan metode algoritma yang terbaik yaitu dengan memperoleh nilai rasio simpangan baku yang bertujuan untuk memperoleh nilai simpangan baku dalam kelompok (SW) yang minimum dan nilai simpangan baku antar kelompok (SB) yang maksimum. Model terbaik yang diperoleh yaitu menggunakan K-Medoids lebih baik dilihat dari perbandingan rasio simpangan baku kemudian diaplikasikan dalam analisis sentiment wilayah kabupaten/kota di Indonesia berdasarkan angka IPM masing-masing wilayahnya sehingga didapatkan wilayah dengan angka IPM tertinggi dan wilayah dengan IPM terendah pada tahun 2019.  
Bayesian Network Model to Distinguish COVID-19 for Illness with Similar Symptoms Emir Luthfi; Arie Wahyu Wijayanto
Proceedings of The International Conference on Data Science and Official Statistics Vol. 2021 No. 1 (2021): Proceedings of 2021 International Conference on Data Science and Official St
Publisher : Politeknik Statistika STIS

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.34123/icdsos.v2021i1.36

Abstract

Numerous diseases and illnesses exhibit similar physical and medical symptoms, such as COVID-19 and its similar disguised illness (common cold, flu, and seasonal allergies). In this study, we construct a Bayesian Network model to distinguish such symptom variables in a classification task. The Bayesian Network model has been widely used as a classifier comparable to machine learning models. We develop the model with a scoring-based method and implement it using a hill-climbing algorithm with the Bayesian information criterion (BIC) score approach. Experimental evaluations using publicly available Mayo Clinic based data using this Bayesian Network model that present Directed Acyclic Graph (DAG) which can show the relationship between the similar symptoms and the type of disease with Conditional Probability Table (CPT). This model shows a promising accuracy performance up to 93.14% which is better than the performance of other machine learning classifiers, including the Support Vector Machine (SVM) and the ensemble approaches such as Random Forest (RF), while slightly smaller than that of the neural networks (NN).