Penelitian ini bertujuan untuk membandingkan kinerja dua algoritma klasifikasi machine learning, yaitu Decision Tree dan Random Forest, dalam mengklasifikasikan produk berdasarkan data penjualan pada dataset Sample Superstore. Tujuan klasifikasi adalah untuk mengelompokkan produk ke dalam dua kategori, yaitu “laris” dan “tidak laris”, berdasarkan perbandingan antara nilai Quantity dengan nilai rata-rata dataset. Penelitian diawali dengan tahapan pra-pemrosesan seperti penghapusan data duplikat, pengolahan variabel kategorikal dengan label encoding, standardisasi fitur numerik, dan pembentukan variabel target biner. Model klasifikasi dilatih dan dievaluasi menggunakan confusion matrix serta metrik performa seperti akurasi, precision, recall, dan F1-score. Tuning parameter dilakukan pada kedua model menggunakan GridSearchCV dengan validasi silang lima lipat. Hasil evaluasi menunjukkan bahwa algoritma Decision Tree memperoleh akurasi tertinggi sebesar 73,1%, sedikit lebih baik dibandingkan Random Forest yang mencapai akurasi 72,7% setelah dilakukan tuning. Meskipun Random Forest dikenal sebagai algoritma ensemble yang lebih stabil, pada kasus ini performanya tidak menunjukkan peningkatan signifikan. Temuan ini memperkuat pentingnya pemilihan algoritma yang disesuaikan dengan karakteristik dan struktur data.
Copyrights © 2025