Patricia Dian Paska
Informatics, Sanata Dharma University

Published : 1 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 1 Documents
Search

ANALISIS PERBANDINGAN ALGORITMA KNN, GAUSSIAN NAIVE BAYES, RANDOM FOREST UNTUK DATA TIDAK SEIMBANG DAN DATA YANG DISEIMBANGKAN DENGAN METODE TOMEK LINK UNDERSAMPLING PADA DATASET LCMS TANAMAN KELADI TIKUS Iwan Binanto; Nesti Fronika Sianipar; Ni Made Dina Aprilianti; Jeanytha Gein; Patricia Dian Paska
Prosiding Sains Nasional dan Teknologi Vol 13, No 1 (2023): PROSIDING SEMINAR NASIONAL SAINS DAN TEKNOLOGI 2023
Publisher : Fakultas Teknik Universitas Wahid Hasyim

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.36499/psnst.v13i1.9002

Abstract

Data tidak seimbang adalah data yang mempunyai kelas mayoritas dan kelas minoritas dalam hal ini merupakan kelas target karena satu kelas melebihi jumlah kelas lain dalam dataset. Salah satu data tidak seimbang didapat pada penelitian Binanto, et. al. yang merupakan data LCMS dari tanaman Keladi Tikus hasil penelitian Sianipar et. al. Data ini tidak seimbang karena target biner yang menyatakan senyawa anti kanker dan senyawa biasa sangat kontras. Penelitian ini bertujuan untuk mengevaluasi potensi tanaman keladi tikus dalam pengobatan penyakit serta menjelaskan mekanisme yang mungkin terlibat. Untuk itu diperlukannya sebuah metode klasifikasi dokumen yang dapat mengelompokkan secara otomatis dan akurat. Terdapat banyak metode klasifikasi yang dapat digunakan. Metode yang digunakan dalam penelitian ini adalah Naive Bayes, Random Forest, dan KNN serta digunakan pula Algoritma Tomek Link Undersampling untuk menyeimbangkan data. Dari penelitian ini didapatkan bahwa Algoritma Random Forest merupakan algoritma yang paling tepat untuk menyelesaikan permasalahan Imbalanced Data maupun Balanced Data dengan menggunakan Tomek Links Undersampling karena algoritma ini memiliki nilai accuracy, precision, recall dan F1-Score yang tinggi dibanding algoritma lainnya.