Jiko (Jurnal Informatika dan komputer)
Vol 4, No 1 (2021)

PENERAPAN TEKNIK KOMBINASI OVERSAMPLING DAN UNDERSAMPLING UNTUK MENGATASI PERMASALAHAN IMBALANCED DATASET

Ariani Indrawati (Lembaga Ilmu Pengetahuan Indonesia)



Article Info

Publish Date
21 Apr 2021

Abstract

Salah satu permasalahan pada machine learning yang cukup sering terjadi adalah ketidakseimbangan data yang digunakan atau sering disebut dengan imbalanced dataset. Cukup banyak penelitian yang melaporkan bahwa imbalanced dataset ini seringkali memberikan hasil yang keliru. Perlu ada penanganan khusus sebelum imbalanced dataset tersebut dapat digunakan pada machine learning. Cara paling populer dan efektif dalam mengatasi permasalahan imbalanced dataset adalah melakukan resampling, baik oversampling, undersampling, ataupun kombinasi keduanya. Pada penelitian ini akan dilakukan uji coba teknik kombinasi dengan menggabungkan teknik oversampling Synthetic Minority Oversampling Technique (SMOTE) dengan teknik undersampling Edited Nearest Neighbors (ENN) dan TomekLinks terhadap Support Vector Machine (SVM). Tiga public dataset UCI yaitu Breast Cancer Wisconsin, Pima Indian Diabetes, dan Heart Disease Detection digunakan pada penelitian ini dengan Python sebagai alat bantu pemrograman. Berdasarkan hasil uji coba yang dilakukan diketahui bahwa teknik kombinasi dapat membantu mengatasi permasalahan imbalanced dataset pada machine learning, SMOTE-ENN dapat meningkatkan performa akurasi dari SVM sebesar 2% hingga 23%.

Copyrights © 2021






Journal Info

Abbrev

jiko

Publisher

Subject

Computer Science & IT

Description

Jiko (Jurnal Informatika dan Komputer) Ternate adalah jurnal ilmiah diterbitkan oleh Program Studi Teknik Informatika Universitas Khairun sebagai wadah untuk publikasi atau menyebarluaskan hasil - hasil penelitian dan kajian analisis yang berkaitan dengan bidang Informatika, Ilmu Komputer, Teknologi ...