Jurnal Sains, Nalar, dan Aplikasi Teknologi Informasi
Vol. 1 No. 1 (2021)

PENANGANAN IMBALANCE DATA PADA KLASIFIKASI KEMUNGKINAN PENYAKIT STROKE

Siti Mutmainah (Department of Informatics, Universitas Islam Indonesia)



Article Info

Publish Date
19 Aug 2021

Abstract

Penanganan imbalance data dilakukan untuk menangani distribusi data yang tidak imbangnya antar class mayoritas dan class minoritas, hal ini dapat mengakibatkan Machine Learning keliru dalam melakukan klasifikasi. Aritkel ini menyajikan reviu jurnal literatur yang pernah dilakukan dalam kurun tahun 2013-2021 dalam penanganan imbalance data. Penanganan imbalance data digunakan agar distribusi antar data class mayoritas dan class minoritas menjadi seimbang. Metode, akurasi atau performa dan dataset yang digunakan oleh literatur dalam klasifikasi akan dibandingkan. Berdasarkan reviu, performa yang dihasilkan cukup beragam dan terdapat beberapa teknik yang dapat dilakukan untuk menangani Imbalance data. Teknik-teknik tersebut bekerja dengan mendorong class minoritas mengubah distribusi class minoritas dan mayoritas. Teknik yang digunakan yaitu Random oversampling dan Random undersampling pada kemungkinan penyakit stroke. Penanganan Imbalance data dilakukan antar class 1 (Stroke) dan class 0 (tidak stroke) dengan distribusi antar data sama. Hasil yang didapatkan pada penggunaan teknik random oversampling mendapat performa yang lebih tinggi yaitu 95% daripada teknik random undersampling yang mendapat performa 76%.

Copyrights © 2021






Journal Info

Abbrev

jurnalsnati

Publisher

Subject

Computer Science & IT

Description

Jurnal SNATi publishes original research articles on various topics related to computer science, information technology, systems engineering, and complementary ...