J I M P - Jurnal Informatika Merdeka Pasuruan
Vol 5, No 1 (2020): MARET

Analisis Pemeringkatan Kualitas Klasifier Pada Dataset Tidak Seimbang

Choirul Anam (Prodi Sistem Informasi AMIK Taruna Probolinggo)
Ninanesia Rusdiana (Prodi Sistem Informasi AMIK Taruna Probolinggo)



Article Info

Publish Date
13 Jun 2020

Abstract

Algoritma klasifikasi C4.5, CART, k-Nearest Neighbours (k-NN) dan Naive Bayes termasuk dalam “Top 10 algorithms in data mining”. Penulis melakukan pengujian dan analisis pada keempatnya untuk mendapatkan urutan peringkat menurut kualitas kinerjanya. Metode yang umum dan cukup memadai untuk membandingkan kualitas kinerja klasifier untuk klasifikasi dua label kelas dengan proporsi jumlah kelas dari dataset yang seimbang adalah dengan menguji kinerja accuracy klasifier. Untuk dataset yang tidak seimbang seperti dalam penelitian ini menggunakan metode ini bisa bias, bahkan bisa menghasilkan kesimpulan yang menyesatkan. Dengan menghitung skor nilai yang merupakan gabungan dari parameter kinerja “accuracy”, “precision”, “recall” dan “AUC” dimana nilai tertinggi dari masing-masing parameter adalah yang terbaik akan menghasilkan penilaian kinerja klasifier yang lebih representatif menunjukkan kualitas klasifier. Dilakukan dua metode pengujian yaitu 10-fold Cros Validation dan Pengujian Secara Diskrit untuk memastikan hasil penilaian kinerja yang representatif dari masing-masing klasifier. Penerapan pengujian terhadap empat algoritma klasifikasi diatas dan analisis perbandingan kinerja menghasilkan urutan peringkat kualitas kinerja terbaik yaitu: 1. k-NN, 2. C4.5, 3. CART, 4. Naive Bayes.Kata Kunci: C4.5, CART, k-NN, Naive Bayes, skor

Copyrights © 2020






Journal Info

Abbrev

informatika

Publisher

Subject

Computer Science & IT

Description

Jurnal Informatika Merdeka Pasuruan (JIMP) terbit 3 kali dalam satu tahun yaitu dibulan maret, agustus dan desember. Memuat tulisan ilmiah yang berhubungan dengan bidang teknologi informasi serta aplikasi teknik informatika. Jurnal JIMP terbitan berkala ini adalah hasil penelitian dari tugas akhir ...