Jurnal Informatika Polinema (JIP)
Vol. 12 No. 3 (2026): Vol. 12 No. 3 (2026)

Komparasi Metode SMOTE-Tomek dan SMOTE-ENN untuk Mengatasi Data Imbalanced

Fandi Yulian Pamuji (Universitas Merdeka Malang)
Mohammad Dwi Irfan Affandi (Universitas Merdeka Malang)
Andriyan Rizki Jatmiko (Universitas Merdeka Malang)



Article Info

Publish Date
31 May 2026

Abstract

Perkembangan teknologi informasi dan data analisis saat ini mendorong meningkatnya pemanfaatan machine learning dalam berbagai bidang. Namun, salah satu permasalahan umum yang sering muncul dalam penerapan machine learning adalah kondisi data tidak seimbang (imbalanced data) yaitu ketidakseimbangan jumlah data antar kelas, di mana kelas mayoritas jauh lebih dominan dibandingkan kelas minoritas. Untuk mengatasi permasalahan dataset tidak seimbang adalah dengan menyeimbangkan distribusi kelas tidak seragam di antara kelas-kelas dengan komparasi menggunakan metode SMOTE-Tomek dan SMOTE-ENN supaya jumlahnya seimbang dari kelas mayoritas (negatif) maupun kelas minoritas (positif). Berdasarkan hasil eksperimen yang telah dilakukan dari penelitian ini yaitu bahwa pengujian metode SMOTE-Tomek dengan metode klasifikasi mampu menangani jumlah kelas mayoritas (negatif) dan kelas minoritas (positif) pada data tidak seimbang dengan menghasilkan nilai MCC dan G-mean mencapai kinerja prediksi yang lebih besar dibandingkan dengan menggunakan metode klasifikasi saja maupun menggunakan Metode SMOTE-ENN. Kemudian untuk dataset Binary nilai MCC dan G-mean yang paling tinggi menggunakan SMOTE-ENN + Random Forest dengan nilai tertinggi MCC = 0.99 dan nilai G-mean = 0.99 dari nilai MCC dan G-mean diatas akurasinya sudah bagus karena nilai MCC dan G-mean yang mendekati 1 menunjukkan bahwa model memiliki performa klasifikasi yang sangat baik dalam menangani data tidak seimbang dengan menggunakan Metode SMOTE-Tomek + Random Forest dapat mencapai kinerja prediksi yang lebih besar untuk menangani dataset tidak seimbang Binary. Hal tersebut menunjukkan bahwa proses penanganan terhadap distribusi kelas yang tidak seimbang pada tahap preprocessing data memberikan pengaruh terhadap nilai akurasi MCC maupun G-mean metode SMOTE-Tomek + Random Forest.

Copyrights © 2026






Journal Info

Abbrev

jip

Publisher

Subject

Computer Science & IT Control & Systems Engineering Decision Sciences, Operations Research & Management Electrical & Electronics Engineering Library & Information Science

Description

The focus and scope of articles published in JIP (Journal of Informatics Polinema) encompasses the game technology, information system, computer network, computing, which covers the following scope: Game Technology Artificial Intelligence Intelligent System Machine Learning Image Processing Computer ...