J Statistika: Jurnal Ilmiah Teori dan Aplikasi Statistika
Vol 15 No 2 (2022): Jurnal Ilmiah Teori dan Aplikasi Statistika

Perbandingan Metode LightGBM dan XGBoost dalam Menangani Data dengan Kelas Tidak Seimbang

Putri Septiana Rizky (Universitas Hamzanwadi)
Ristu Haiban Hirzi (Universitas Hamzanwadi)
Umam Hidayaturrohman (Universitas Hamzanwadi)



Article Info

Publish Date
31 Dec 2022

Abstract

Masalah ketidakseimbangan kelas telah menjadi salah satu tantangan dalam kinerja banyak algoritma klasifikasi. Kelas tidak seimbang merupakan suatu kondisi dimana terdapat dataset yang jumlah kelasnya terdapat perbedaan yang signifikan terhadap masing-masing jumlah kelas. Dalam kumpulan data yang terdiri dari dua kelas, ukuran sampel kategori mayoritas (lebih besar) mendominasi sampel kategori minoritas (lebih kecil) dengan rasio sebesar 1:100, 1:1.000 atau 1:10.000. Dampak ketidakseimbangan ini menyebabkan klasifikasi menjadi buruk dan tidak optimal. Sebagian besar algoritma klasifikasi standar cenderung mengklasifikasikan kelas mayoritas dengan tingkat akurasi tinggi dan kelas minoritas dengan tingkat akurasi rendah, sehingga mengakibatkan terjadinya bias. Dalam banyak aplikasi, lebih penting untuk mengidentifikasi kelas minoritas dari pada kelas mayoritas. Pada penelitian ini diusulkan pendekatan berbasis ensemble dengan pengklasifikasi yang digunakan adalah LightGBM dan XGBoost, kedua metode ini merupakan metode gradien efisien yang beberapa tahun terakhir telah disarankan berdasarkan pohon keputusan sehingga mampu menangani masalah data dengan skala besar. Data yang digunakan diperoleh dari UCI Repository dengan 5 data, 3 diantaranya memiliki tingkat ketidakseimbangan tinggi dan sisanya dengan tingkat ketidakseimbangan rendah. Jumlah kelas yang digunakan pada penelitian adalah dua kelas. Hasil penelitian menunjukkan bahwa kinerja metode XGBoost dalam akurasi dan sensitivitas lebih baik dibandingkan LightGBM di hampir seluruh data. Sedangkan kemampuan dalam menebak kelas minoritas (spesifisitas), metode LightGBM lebih baik dibandingkan XGBoost dengan nilai keseluruhan rata-rata sebesar 80,41% : 74,64%.

Copyrights © 2022






Journal Info

Abbrev

jstatistika

Publisher

Subject

Decision Sciences, Operations Research & Management Economics, Econometrics & Finance

Description

Merupakan Media Penerbitan Dan Pembahasan Karya Ilmiah Dalam Bidang Ilmu Statistika Beserta Aplikasinya, Baik Berupa Hasil Penelitian, Bahasan Tentang Teori, Metodologi, Komputasi, Maupun Aplikasi Statistika Dalam Bidang ...