Claim Missing Document
Check
Articles

Comparative Analysis of Hierarchical, K-Means, and K-Medoids Clustering and Methods in Grouping Indonesia's Human Development Index in 2019 Luthfi, Emir; Wijayanto, Arie Wahyu
INOVASI Vol 17, No 4 (2021)
Publisher : Faculty of Economics and Business Mulawarman University

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (469.605 KB) | DOI: 10.29264/jinv.v17i4.10106

Abstract

Dalam cabang ilmu data mining sudah banyak dilakukan analisis pengelompokan (clustering analysis) yang berguna untuk dapat mengelompokkan suatu data observasi tertentu. Pada penelitian digunakan dataset terkait Indeks Pembangunan Manusia (IPM) di Indonesia tahun 2019 dan dilakukan pengelompokkan variabel pembangun Indeks Pembangunan Manusia (IPM) yang terdiri dari angka harapan hidup, angka melek huruf, rata-rata lamanya sekolah, dan pengeluaran perkapita yang disesuaikan menggunakan metode Hirearchical, K-Means, dan K-Medoids Clustering. Metode Hirearchical yang digunakan yaitu dengan metode Algomerative menggunakan kemiripan jarak dengan Ward Method. Dari hasil ketiga metode tersebut akan dibandingkan untuk memperoleh metode yang terbaik dengan melihat ukuran validitas dari nilai Dunn Index (DN), Davies Bouldin Index (DB), Calinski-Harabasz Index (CH) serta untuk menentukan jumlah klaster/kelompok yang optimum dan yang terpenting dalam membandingkan untuk mendapatkan metode algoritma yang terbaik yaitu dengan memperoleh nilai rasio simpangan baku yang bertujuan untuk memperoleh nilai simpangan baku dalam kelompok (SW) yang minimum dan nilai simpangan baku antar kelompok (SB) yang maksimum. Model terbaik yang diperoleh yaitu menggunakan K-Medoids lebih baik dilihat dari perbandingan rasio simpangan baku kemudian diaplikasikan dalam analisis sentiment wilayah kabupaten/kota di Indonesia berdasarkan angka IPM masing-masing wilayahnya sehingga didapatkan wilayah dengan angka IPM tertinggi dan wilayah dengan IPM terendah pada tahun 2019.  
Perbandingan Kinerja Metode Bagging dan Non-Ensemble Machine Learning pada Klasifikasi Wilayah di Indonesia menurut Indeks Pembangunan Manusia Kemala, Intan; Wijayanto, Arie Wahyu
JUSTIN (Jurnal Sistem dan Teknologi Informasi) Vol 9, No 2 (2021)
Publisher : Jurusan Informatika Universitas Tanjungpura

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (1048.874 KB) | DOI: 10.26418/justin.v9i2.44166

Abstract

Indeks Pembangunan Manusia (IPM) sendiri merupakan suatu ukuran yang digunakan untuk mengukur pencapaian pembangunan manusia di suatu wilayah. Capaian tinggi rendahnya nilai IPM di Indonesia tidak terlepas dari program pembangunan yang dilaksanakan pemerintah di tiap wilayah Indonesia baik itu tingkat pusat maupun daerah. Penentuan program pembangunan yang dilakasanakan harus tepat sasaran dan sesuai dengan prioritas daerah berdasarkan kategori IPM yang dimiliki. Untuk membantu efektifitas kinerja pemerintah dalam menganalisis kategori IPM masing-masing daerah di Indonesia, dilakukan penelitian terkait klasifikasi Indeks Pembangunan Manusia di Indonesia menggunakan 4 indikator berbeda yakni Indeks Pemberdayaan Gender, Indeks Keparahan Kemiskinan, Rata-Rata Lama Sekolah, dan Pengeluaran per Kapita dengan menerapkan beberapa algoritma klasifikasi sebagai perbandingan antara lain Random Forest untuk mewakili metode Bagging, serta C4.5 Decision Tree, K Nearest Neighbors, dan Naive Bayes yang mewakili metode non-ensemble. Proses klasifikasi diawali dengan pengumpulan data yang sudah tersedia di website BPS; preprocessing data berupa feature selection, cleaning, integrasi, dan transformasi; dilanjutkan proses pembuatan model pada data training dengan menerapkan 10-fold cross validation serta metode SMOTE untuk menangani imbalance class; dan terakhir evaluasi hasil pemodelan pada data testing. Dari hasil pemodelan dan testing didapat hasil bahwa metode Random Forest dengan mtry = 2 dan ntree = 500 merupakan metode terbaik diantara metode lainnya dimana akurasi klasifikasi yang dihasilkan sebesar 95.41% dan nilai Kappa sebesar 83.46%.
Klasifikasi Rumah Tangga Penerima Subsidi Listrik di Provinsi Gorontalo Tahun 2019 dengan Metode K-Nearest Neighbor dan Support Vector Machine Hutahaean, Yohana Madame; Wijayanto, Arie Wahyu
JUSTIN (Jurnal Sistem dan Teknologi Informasi) Vol 10, No 1 (2022)
Publisher : Jurusan Informatika Universitas Tanjungpura

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (375.193 KB) | DOI: 10.26418/justin.v10i1.51210

Abstract

Program subsidi listrik merupakan salah satu program pemerintah untuk penanganan kemiskinan, dimana keluarga tidak mampu mendapatkan bantuan subsidi listrik yang dibayarkan pemerintah ke PT Perusahaan Listrik Negara (PLN). Permasalahannya adalah masih terdapat rumah tangga yang mampu secara ekonomi namun tetap mendapatkan subsidi listrik. Penelitian ini bertujuan untuk melakukan klasifikasi rumah tangga penerima subsidi listrik menggunakan data mining serta melakukan perbandingan hasil klasifikasi dengan metode K-Nearest Neighbor  (KNN) dan Support Vector Machine (SVM). Alasan pemilihan metode ini dibandingkan metode lainnya dalam data mining, KNN merupakan metode yang dapat mewakili lazy learning dan SVM merupakan metode klasifikasi yang dapat memberikan generalisasi. Data yang digunakan adalah data Susenas Provinsi Gorontalo tahun 2019. Variabel yang digunakan adalah status penerimaan subsidi listrik sebagai kelas dan variabel penjelas (atribut) mencakup jumlah anggota rumah tangga, status kepemilikan bangunan, luas lantai rumah, bahan atap rumah terluas, bahan dinding terluas, bahan lantai rumah terluas, sumber air minum utama, bahan bakar utama untuk memasak, dan tempat pembuangan akhir tinja. Program yang digunakan dalam pengolahan data adalah R. Hasil penelitian menunjukkan bahwa metode KNN memiliki akurasi yang lebih baik dalam melakukan klasifikasi yaitu sebesar 98,07%. Secara keseluruhan, terdapat perbedaan yang signifikan dari klasifikasi KNN dan SVM, dimana kinerja KNN jauh lebih baik dari SVM dalam melakukan klasifikasi.
Klasifikasi Rumah Tangga Penerima Beras Miskin (Raskin)/Beras Sejahtera (Rastra) di Provinsi Jawa Barat Tahun 2017 dengan Metode Random Forest dan Support Vector Machine Iman, Qonita; Wijayanto, Arie Wahyu
JUSTIN (Jurnal Sistem dan Teknologi Informasi) Vol 9, No 2 (2021)
Publisher : Jurusan Informatika Universitas Tanjungpura

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/justin.v9i2.44137

Abstract

Program Beras Miskin (Raskin) atau Beras Sejahtera (Rastra) merupakan program subsidi pemerintah dalam bentuk non-tunai yakni beras yang bertujuan menanggulangi kemiskinan dan memberikan perlindungan sosial di bidang pangan. Sayangnya, program ini masih belum berjalan efektif sepenuhnya. Permasalahan yang masih terjadi salah satunya mengenai rumah tangga sasaran. Penelitian ini bertujuan untuk melakukan klasifikasi/pengelompokkan rumah tangga penerima Raskin/Rastra menggunakan pendekatan data mining serta melakukan perbandingan metode yakni Random Forest dengan SVM (Support Vector Machine). Data yang digunakan merupakan data mikro Susenas Provinsi Jawa Barat tahun 2017. Variabel yang digunakan adalah penerima bantuan Raskin/Rastra sebagai target/kelas dan variabel penjelas (atribut) yang terdiri dari pekerjaan KRT, luas lantai, jenis dinding, jenis lantai, sumber air, sumber penerangan, pengeluaran per kapita. Program yang digunakan untuk pengolahan data adalah SPSS dan R. Hasil penelitian menunjukkan metode random forest dan SVM memiliki ketelitian yang cukup baik dalam melakukan klasifikasi, yakni sebesar 71–72%. Secara keseluruhan, selisih kinerja klasifikasi kedua metode random forest dan SVM memiliki kinerja yang sama baiknya dalam melakukan klasifikasi.
Algoritma Support Vector Machine, Conditional Inference Trees, dan Random Forest untuk Klasifikasi Capaian Belajar Siswa SMP di Indonesia Tahun 2019 Alfina Nurpiana; Arie Wahyu Wijayanto
Jurnal Matematika, Statistika dan Komputasi Vol. 18 No. 3 (2022): MAY, 2022
Publisher : Department of Mathematics, Hasanuddin University

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.20956/j.v18i3.19208

Abstract

Indonesian JHS students' learning achievement is still low. During 2015-2019, the average national exam score for Indonesian JHS has always decreased. In the last national examination, the average national exam score was 52.82 and was included in the bad category. This certainly needs to be a concern for local governments and the education office. Therefore, it is necessary to form a classification model that can be used to identify cities/districts in Indonesia which are categorized as bad or enough. This study discusses the comparison of models for the classification of learning achievement categories as seen from the average 2019 JHS results in 514 districts/cities in Indonesia using the Support Vector Machine (SVM), Conditional Inference Trees (Ctree), and Random Forest (RF) algorithms. The three algorithms were chosen because of their respective advantages, namely the SVM algorithm is known to be very powerful, Ctree as an improvement from the usual decision tree, and RF to represent ensemble learning. The independent variables used are education budget, classroom conditions, school accreditation, and teacher qualifications. From the results of this study, it has been found that the SVM algorithm produces the highest accuracy (0,80), recall (0,97), kappa statistics (0,38), and F1-score (0,87) compared to the Ctree and RF algorithms, while only precision (0,80) has the same value as the Ctree algorithm. So, the SVM algorithm produces the best model for the classification of district/city learning achievement categories in Indonesia based on education budget, classroom conditions, school accreditation, and teacher qualifications.
Analisis Perbandingan Pengelompokan Indeks Pembangunan Manusia Indonesia Tahun 2019 dengan Metode Partitioning dan Hierarchical Clustering Arina Mana Sikana; Arie Wahyu Wijayanto
Jurnal Ilmu Komputer Vol 14 No 2 (2021): Jurnal Ilmu Komputer
Publisher : Informatics Department, Faculty of Mathematics and Natural Sciences, Udayana University

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.24843/JIK.2021.v14.i02.p01

Abstract

Human Development Index (HDI) is an important indicator in measuring the level of success of the development of the quality of human life. Human Development Index clustering aims to divide the regions into groups based on Human Development Index for the region in 2019. Human Development Index clustering compares Partitioning Clustering and Hierarchical Clustering method to divide Human Development Index Indonesia in 2019. Partitioning Clustering method uses K-Means Clustering algorithm and Hierarchical Clustering method uses Agglomerative Ward Clustering algorithm. The results obtained are the best method for grouping provinces in Indonesia based on Human Development Index in 2019 is K-Means Clustering method with the optimum number of clusters is 6. This method gives Silhoutte Score o0,6291, Calinski-Harabasz Index 241,8875, dan Davies-Bouldin Index 0,3038. While the best method for grouping regencies in Indonesia based on Human Development Index in 2019 is K-Means Clustering method with the optimum number of clusters is 6. This method gives Silhoutte Score 0,5511, Calinski-Harabasz Index 1525,4007, dan Davies-Bouldin Index 0,5234.
Analisis Cluster dengan Metode Partitioning dan Hierarki pada Data Informasi Kemiskinan Provinsi di Indonesia Tahun 2019 Natasya Afira; Arie Wahyu Wijayanto
Komputika : Jurnal Sistem Komputer Vol 10 No 2 (2021): Komputika: Jurnal Sistem Komputer
Publisher : Computer Engineering Departement, Universitas Komputer Indonesia

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.34010/komputika.v10i2.4317

Abstract

Poverty is an important indicator in seeing the success of a country's economic development. The poverty rate in Indonesia is 9.22 percent with a total poor population of 24.79 million people. Poverty data in each region will be different, influenced by various indicators. Therefore, it is important to categorize regions in Indonesia based on poverty characteristics so that the government can make the right policies related to poverty reduction. This study uses two clustering methods, namely partitioning and hierarchy to group provinces in Indonesia based on poverty characteristics. The partitioning method chosen is K-Means. The data used are 8 poverty variables in 34 provinces in Indonesia in 2019 The determination of the number of clusters using internal validation and stability validation shows that the hierarchical method with the optimum number of clusters 2 produces the most optimal clusters. The comparison of the hierarchical method is assessed based on the agglomerative coefficient, where the Ward method is able to provide the best grouping results.
Klasifikasi Pengembalian Radar dari Ionosfer Menggunakan SVM, Naïve Bayes dan Random Forest Yulia Aryani; Arie Wahyu Wijayanto
Komputika : Jurnal Sistem Komputer Vol 10 No 2 (2021): Komputika: Jurnal Sistem Komputer
Publisher : Computer Engineering Departement, Universitas Komputer Indonesia

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.34010/komputika.v10i2.4347

Abstract

ABSTRAK – Klasifikasi merupakan salah satu topik utama dalam data mining atau machine learning. Klasifikasi adalah suatu pengelompokan data dimana data yang digunakan tersebut mempunyai kelas label atau target. Klasifikasi digunakan untuk mengambil data dan ditempatkan kedalam kelompok tertentu. Studi tentang ionosfer penting untuk penelitian di berbagai domain, khususnya dalam sistem komunikasi. Dalam penelitian ionosfer, perlu dilakukan klasifikasi radar yang berguna dan tidak berguna dari ionosfer. Pada makalah ini, akan dilakukan klasifikasi terhadap data inosphere yang diambil dari UCI machine learning repository. Klasifikasi dilakukan dengan menggunakan tiga metode klasifikasi, yakni SVM ( Support Vector Machine ) , Naïve Bayes, dan Random Forest. Hasil dari percobaan ini bisa menunjukkan prediksi dari setiap percobaan dengan tingkat akurasi dan prediksi yang berbeda-beda di setiap metode yang digunakan. Hasil akurasi, presisi, dan recall terbaik didapatkan pada metode Random Forest dengan rasio data latih dan data uji sebesar 85% didapat akurasi dari data uji sebesar 90,57% dengan presisi sebesar 94,12%. Kata Kunci – Ionosfer; Klasifikasi; SVM; Naïve Bayes; Random Forest.
Analisis Komparasi Algoritma Klasifikasi Data Mining Dalam Klasifikasi Website Phishing Nabila Bianca Putri; Arie Wahyu Wijayanto
Komputika : Jurnal Sistem Komputer Vol 11 No 1 (2022): Komputika: Jurnal Sistem Komputer
Publisher : Computer Engineering Departement, Universitas Komputer Indonesia

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.34010/komputika.v11i1.4350

Abstract

Phishing is a fraudulent act carried out to try to get important information from users who use the internet by sending fake e-mails to the users. Data mining classification techniques can be used to predict phishing websites. Many data mining classification algorithms can be used, so it is necessary to make comparisons to determine the level of accuracy of each algorithm. The algorithm used is naïve Bayes, random forest, decision tree, and support vector machine. The data used are 1.353 websites data. The results of the classification process are evaluated using cross validation and confusion matrix to find out the most accurate data mining classification algorithms for predicting phishing websites.
Classification of Village Development Index at Regency/Municipality Level Using Bayesian Network Approach with K-Means Discretization Nasiya Alifah Utami; Arie Wahyu Wijayanto
Jurnal Aplikasi Statistika & Komputasi Statistik Vol 12 No 3 (2020): Jurnal Aplikasi Statistika dan Komputasi Statistik Edisi Khusus
Publisher : Pusat Penelitian dan Pengabdian kepada Masyarakat Politeknik Statistika STIS

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.34123/jurnalasks.v14i1.390

Abstract

Village development has been one of the most important targets of government policies in Indonesia in order to fully optimize its potential. Under Law 06 Year 2014 on Villages, local governments from regency/municipality level to village level are required to understand their respective village potentials in order to increase the village potentials in their regions. In this paper, we build and analyze the Bayesian network methods to classify the village development index at regency/municipality and gain a better understanding of the causal relationships between independent variables of the village potential status. Using a web scraping method of information retrieval, data are collected from the Ministry of Village, Development of Disadvantaged Regions, and Transmigration (Kemendesa) website, and Village Development Evaluation (Indeks Pembangunan Desa—IPD) of Statistics Indonesia (BPS) publication in 2018 data. Further, we combine the discretization using the K-Means clustering method to handle the continuous nature of retrieved data. An extensive comparison of different learning structures of the Bayesian Network is performed, which includes the learning structure of Naive Bayes, Maximum Spanning Tree with weighted Spearman correlation coefficient, Hill Climbing search, and Tabu Search during the construction of Bayesian networks. For fairness evaluation, all constructed models are built using 80% data as a training set and the remaining 20% as a testing set. The results show that Bayesian network approach can be applied in village development index status classification where the construction using maximum spanning tree with K-Means data discretization gain the best performance of 90.69% accuracy.
Co-Authors A.A. Ngurah Gede, Wasudewa Achmad Muchlis Abdi Putra Akhmad Fatikhurrizqi Alfina Nurpiana Alvia Rossa Damayanti Alya Azzahra Andriansyah Muqiit Wardoyo Saputra Annisa Firnanda Arbi Setiyawan Arif Handoyo Marsuhandi Arina Mana Sikana Ariyani, Marwah Erni Atut Pindarwati Ayu Aina Nurkhaliza Az-Zahra, Afifah Bagus Almahenzar Bony Parulian Josaphat Chisan, Innas Khoirun Daulay, Nur Ainun Desi Kristiyani Dewi, Ni Kadek Ayu Purnami Sari Dwi Karunia Syaputri Dwi Wahyu Triscowati Emir Luthfi Fauzan Faldy Anggita Fauzan, Fardhi Dzakwan Febrian, M. Yandre Feriyanto, Muhamad Ghina Rofifa Suraya He Youshi Hutahaean, Yohana Madame Ika Yuni Wulansari Ikhsanudin, Muhammad Rafi Iman, Qonita Intan Kemala Iskanda, Doddy Aditya Iskanda, Watekhi Izzuddin, Kautsar Hilmi Kurniawan, Bayu Dwi Luthfi, Emir Maghfiroh, Meilinda F N Maghfiroh, Meilinda F. N. Margareth Dwiyanti Simatupang Maria Angelika H Siallagan Maria Shawna Cinnamon Claire Marsisno, Waris Marsisno, Waris Maulana, Farhan Maulidya, Luthfi Muhammad Rezza Ferdiansyah Munifah Zuhra Almasah Nabila Bianca Putri Nasiya Alifah Utami Natasya Afira Natasya Afira Ningrum, Icha Wahyu Kusuma Ningsih, I Kadek Mira Merta Nissa Shahadah Qur'ani Nora Dzulvawan Nurafiza Thamrin Nursiyono, Joko Ade Parwanto, Novia Budi Pasaribu, Ernawati Perani Rosyani Permatasari, Noverlina Putri Pindarwati, Atut Pramana, Setia Prasetyo, Rindang Bangun Pratama, Ahmad R. Prayoga, Suhendra Widi Putri, Salwa Rizqina Putri, Salwa Rizqina Rahmawati, Delvina Nur Raisa Rizky Amelia Rahman Raisa Rizky Amelia Rahman Regita Iswari Puri, Ida Ayu Wayan Renata De La Rosa Manik Ressa Isnaini Arumnisaa Ridho, Farid Rifqi Ramadhan Rifqi Ramadhan Robert Kurniawan, Robert Rudianto, Regita Dewanti Salwa Rizqina Putri Suadaa, Lya Hulliyyatus Sugiarto, Sugiarto Wahidya Nurkarim Wahyuni, Krismanti Tri Watekhi watin, Rahma Wilantika, Nori Windy Rahmatul Azizah Wulansari, Ika Yuni Yulia Aryani Yuniarto, Budi Zalukhu, Bill Van Ricardo Zanial Fahmi Firdaus