Terbatasnya dataset klasifikasi emosi tweet berbahasa Indonesia membuat metode active learning menjadi pilihan untuk dapat meningkatkan akurasi model supaya dapat reliable ketika memprediksi data baru. Penelitian ini menjelaskan bagaimana dampak implementasi metode active learning ke dalam aplikasi dengan memanfaatkan data tak berlabel yang dihasilkan oleh aplikasi. Active learning pada penelitian ini menggunakan skenario stream-based selective sampling dan memilih data dengan least confidence uncertainty sampling. Pada penelitian ini dilakukan pengujian membandingkan performa active learning dengan pemilihan data secara acak pada penambahan data 20, 10, dan 50 di setiap iterasi. Menurut hasil yang didapat, model dengan active learning memiliki akurasi yang lebih baik dibandingkan dengan model acak. Model active learning dapat meningkatkan akurasi model 0,23% hingga 1,09% dari akurasi model dasar pada 66,85%.
Copyrights © 2023