Media berita daring menjadi sumber utama informasi masyarakat Indonesia, namun tantangan muncul dalam memahami dan menganalisis konten berita yang singkat dan bersifat implisit serta emosional. Penelitian ini bertujuan mengembangkan sistem klasifikasi ganda untuk judul berita berbahasa Indonesia, dengan mengidentifikasi topik dan sentimen secara bersamaan menggunakan metode supervised learning. Pendekatan yang digunakan meliputi pengumpulan data melalui web scraping dari portal berita, proses labeling manual, preprocessing teks, augmentasi data untuk mengatasi ketidakseimbangan kelas, serta tuning parameter TF-IDF. Sampel penelitian terdiri dari 300 judul berita yang kemudian diolah dan diuji menggunakan algoritma Support Vector Machine (SVM), Naive Bayes, dan Logistic Regression. Analisis data dilakukan dengan metrik akurasi, F1-score, dan confusion matrix. Hasil menunjukkan bahwa model SVM dengan tuning parameter TF-IDF mencapai akurasi tertinggi pada klasifikasi topik, sementara Naive Bayes unggul dalam klasifikasi sentimen setelah augmentasi data, dengan akurasi hingga 94,5%. Kesimpulan, pendekatan ini efektif dalam meningkatkan performa sistem klasifikasi berita singkat dan dapat dikembangkan untuk aplikasi monitoring media digital.
Copyrights © 2025