Nadira Sri Belinda
Unknown Affiliation

Published : 2 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 2 Documents
Search

PENERAPAN ANALISIS CLUSTER ENSEMBLE DENGAN METODE ROCK UNTUK MENGELOMPOKKAN PROVINSI DI INDONESIA BERDASARKAN INDIKATOR KESEJAHTERAAN RAKYAT Nadira Sri Belinda; Izzati Rahmi HG; Hazmira Yozza
Jurnal Matematika UNAND Vol 8, No 2 (2019)
Publisher : Jurusan Matematika FMIPA Universitas Andalas Padang

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.25077/jmu.8.2.108-119.2019

Abstract

Kesejahteraan rakyat pada suatu daerah dapat dilihat dari indikator-indikator yang mampu mengukur kesejahteraan rakyat. Kesejahteraan rakyat pada masing-masing daerah berbeda-beda. Oleh karena itu dapat dilakukan pengelompokan daerah di Indonesia untuk melihat kemiripan kondisi kesejahteraan rakyat di suatu daerah dengan daerah lain sehingga dapat membantu pemerintah dalam menyusun dan menentukan prioritas pembangunan. Data indikator kesejahteraan berupa data campuran. Metode pengelompokan yang dapat digunakan untuk menangani data campuran yaitu metode cluster ensemble dengan menggunakan algoritma CEBMDC (Cluster Ensemble Based Mixed Data Clustering) dengan melakukan pengelompokan untuk data numerik dan data kategorik secara terpisah, selanjutnya hasil pengelompokan digabungkan. Objek pengamatan pada penelitian ini adalah 34 provinsi di Indonesia. pengelompokan untuk data numerik menggunakan metode hirarki agglomerative menghasilkan pengelompokan terbaik dengan nilai CP terkecil diperoleh pada metode Ward dengan 2 cluster. pengelompokan data kategorik menggunakan metode ROCK (Robust Clustering Using Links) dengan nilai CP∗ terbesar diperoleh pada θ = 0.30 yang menghasilkan 4 cluster. Tahap penggabungan (ensemble) menggunakan metode ROCK menghasilkan pengelompokan terbaik pada θ = 0.30 dengan nilai CP∗ terbesar yang menghasilkan 4 cluster yang terdiri dari 1 provinsi pada cluster 1, 19 provinsi pada cluster 2, 10 provinsi pada cluster 3, dan 4 provinsi pada cluster 4.Kata Kunci: Cluster Ensemble, CEBMDC, ROCK, CP, CP∗
SMOTE and Nearmiss Methods for Disease Classification with Unbalanced Data : Case Study: IFLS 5 Anas Rulloh Budi Alamsyah; Salsabila Rahma Anisa; Nadira Sri Belinda; Adi Setiawan
Proceedings of The International Conference on Data Science and Official Statistics Vol. 2021 No. 1 (2021): Proceedings of 2021 International Conference on Data Science and Official St
Publisher : Politeknik Statistika STIS

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.34123/icdsos.v2021i1.240

Abstract

Unbalanced data are often encountered in practice. They complicate the search for a model suitable for classification. This is because the number of individuals who have a history of a disease is less than the number of individuals who do not. We analyse the IFLS 5 data on medical history of a set of patients. We split the dataset in the proportion 80:20 to training and test subsets. Of course, both datasets are unbalanced, with only a small minority of patients who had a stroke. We apply the SMOTE and Nearmiss methods and evaluate the rate of correct classification. After being treated using the two methods, the training data was transformed into balanced data. The classification process is carried out to test the comparison of the effectiveness of the two methods in solving the problem of unbalanced data. Based on the results obtained, it can be concluded that the Nearmiss method is better than SMOTE in balancing the data. It was obtained by comparing several measures such as accuracy, F-score, Kappa, sensitivity, and specificity on the SMOTE and Nearmiss methods.