Bianglala Informatika : Jurnal Komputer dan Informatika Akademi Bina Sarana Informatika Yogyakarta
Vol 11, No 1 (2023): Bianglala Informatika 2023

Implementasi Clustering Data Kasus Covid 19 Di Indonesia Menggunakan Algoritma K-Means

Nofita Sari (Universitas Buana Perjuangan Karawang)
Hanny Hikmayanti Handayani (Universitas Buana Perjuangan Karawang)
Amril Mutoi Siregar (Universitas Buana Perjuangan Karawang)



Article Info

Publish Date
24 Mar 2023

Abstract

Covid19 adalah virus pertama kali terdeteksi di Wuhan, Cina pada akhir Desember 2019. Kasus Covid-19 masuk di Indonesia pada Maret 2020, tercatat mencapai 1.511.712 dengan jumlah kematian 40,858 dan sembuh 1.348.330 kasus. Di Indonesia terdapat 34 provinsi yang menjadi persebaran kasus Covid19. Penelitian ini bertujuan untuk mengelompokkan setiap provinsi di Indonesia ke dalam beberapa cluster tertentu agar mengetahui daerah dengan jumlah kasus yang tergolong tinggi, sedang, rendah. Mengelompokan data kasus Covid19 di provinsi Indonesia menggunakan teknik  clustering dengan menggunakan algoritma K-means. Data yang digunakan sebanyak 7098 data dari tanggal 1 Maret hingga 11 Oktober 2020. Dataset yang digunakan dari website AtapData (atapdata.ai). Mengolah data tersebut menggunakan Google Collaboratory dengan bahasa pemrograman python. Pada penelitian dilakukan optimasi menggunakan metode elbow yang menghasilkan jumlah cluster sebanyak 3 cluster. Pengujian dilakukan untuk mendapatkan nilai K yang optimal. Melakukan evaluasi menggunakan Sum of Square Error (SSE). Dari hasil evaluasi memiliki jumlah optimal K: 3 yaitu 228913736548657.56.Kata Kunci : Covid19, algoritma K means, Clustering, Metode ElbowCovid19 is a virus that was first detected in Wuhan, China at the end of December 2019. Covid-19 cases entered Indonesia in March 2020, it was recorded that it had reached 1,511,712 with 40,858 deaths and 1,348,330 cases of recovery. In Indonesia there are 34 provinces where the spread of Covid19 cases. This study aims to classify each province in Indonesia into certain clusters in order to identify areas with high, medium, low number of cases. The grouping of Covid19 case data in the Indonesian province uses a clustering technique using the K-means algorithm. The data used is 7098 data from March 1 to October 11 2020. The dataset used is from the AtapData website (atapdata.ai). Processing the data using Google Collaboratory with the python programming language. In this research, optimization was carried out using the elbow method which resulted in a total of 3 clusters. Tests are carried out to obtain optimal K values. Evaluation using Sum of Square Error (SSE). From the evaluation results, it has an optimal number of K: 3, namely 228913736548657.56.Keywords: Covid19, K mean algorithm, Clustering, Elbow Method

Copyrights © 2023






Journal Info

Abbrev

Bianglala

Publisher

Subject

Computer Science & IT

Description

JURNAL BIANGLALA INFORMATIKA telah memiliki ISSN baik versi cetak maupun online. Jurnal ini berisi tentang karya ilmiah hasil penelitian yang bertemakan: Sistem Pakar, Sistem Informasi, Web Programming, Mobile Programming, Games Programming, Data Mining, dan Sistem Penunjang ...