Claim Missing Document
Check
Articles

Found 2 Documents
Search

Analisis Sentimen Masyarakat terhadap Kereta Cepat Whoosh pada Platform X menggunakan IndoBERT Hakim, Gibran; Fatyanosa, Tirana Noor; Widodo, Agus Wahyu
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer Vol 8 No 10 (2024): Oktober 2024
Publisher : Fakultas Ilmu Komputer (FILKOM), Universitas Brawijaya

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Infrastruktur kereta api cepat di Indonesia relatif tertinggal dibandingkan negara lain. Perkembangannya baru dimulai dengan proyek kereta cepat Jakarta-Bandung (Whoosh) yang baru dimulai pada 2015 dan selesai pada 2023. Proyek kerja sama Indonesia-China ini sangat menarik perhatian publik, terutama di media sosial seperti X. Penelitian ini bertujuan mengklasifikasikan sentimen publik sebagai positif, negatif, atau netral menggunakan pemrosesan bahasa alami (NLP). IndoBERT sebagai model NLP yang dilatih khusus untuk bahasa Indonesia, digunakan untuk menganalisis sentimen secara efektif. Penelitian ini melakukan pengujian pada dataset Whoosh hasil scraping pada platform X dengan konfigurasi hyperparameter seperti jumlah epoch, learning rate, dan batch size. Performa terbaik dicapai dengan konfigurasi 3 epoch, learning rate 2e-5, dan batch size 32 yang menghasilkan metrik evaluasi accuracy, recall, precision, dan f1-score sebesar 0,78. Hasil ini menunjukkan learning rate yang lebih kecil memberikan pembelajaran yang stabil, sementara batch size yang lebih besar memberikan estimasi gradien yang konsisten. Namun, model kesulitan mengklasifikasikan sentimen netral sehingga sering salah mengklasifikasikannya sebagai positif atau negatif. Hasil ini juga menunjukkan adanya overfitting, di mana model tampil baik pada data pelatihan tetapi menurun pada data pengujian yang menunjukkan fokus berlebihan pada detail dan noise dari data pelatihan. Penelitian ini menyoroti pentingnya pemilihan model dan konfigurasi hyperparameter dalam analisis sentimen.
Deteksi Spam Berbahasa Indonesia Berbasis Teks Menggunakan Model Bert Amin, Muhammad Basil Musyaffa; Hakim, Gibran; Maulana, Muhammad Taufik; Alwan, Muhammad Fajrul; Anggraheni, Hanna Shafira; Naufal, Muhammad Jilan; Yudistira, Novanto
Jurnal Teknologi Informasi dan Ilmu Komputer Vol 11 No 6: Desember 2024
Publisher : Fakultas Ilmu Komputer, Universitas Brawijaya

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.25126/jtiik.2024118121

Abstract

Spam pada SMS dan Email menyebabkan pengalaman kurang menyenangkan bagi pengguna dalam pemanfaatan teknologi. Spam secara umum merupakan sebuah tindakan mengirim pesan yang tidak diinginkan atau tidak diminta kepada sejumlah besar orang. Spam kini dapat ditemui dalam berbagai bentuk, seperti web maupun multimedia. Penelitian ini bertujuan untuk mengevaluasi model berbasis BERT, khususnya IndoBERT dan MultilingualBERT, dalam mendeteksi dan mengklasifikasi spam berbahasa Indonesia pada pesan SMS dan Email. Model yang dipilih kemudian dilatih untuk mengidentifikasi perbedaan antara pesan spam dan bukan spam. Hasil evaluasi pada percobaan menggunakan dataset SMS dan Email memiliki nilai akurasi sebesar 98% pada model IndoBERT dan 95% pada model MultilingualBERT, yang menunjukkan tingkat akurasi yang tinggi. Hasil ini menunjukkan bahwa model BERT efektif dalam mendeteksi pesan spam dalam Bahasa Indonesia.   Abstract Spam on SMS and Email causes an unpleasant experience for users in using technology. Spam in general is the act of sending unwanted or unsolicited messages to a large number of people. Spam can now be found in various forms, such as web and multimedia. This research aims to evaluate BERT-based models, specifically IndoBERT and MultilingualBERT, in detecting and classifying Indonesian spam in SMS and Email messages. The selected model is then trained to identify the differences between spam and non-spam messages. Evaluation results in experiments using SMS and Email datasets have an accuracy value of 98% in the IndoBERT model and 95% in the MultilingualBERT model, which shows a high level of accuracy. These results indicate that the BERT model is effective in detecting spam messages in Indonesian.