Maharani, Titi Safitri
Unknown Affiliation

Published : 1 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 1 Documents
Search

Optimasi Logistic Regression dan Random Forest untuk Deteksi Berita Hoax Berbasis TF-IDF Wahid, Arif Mu'amar; Turino, Turino; Nugroho, Khabib Adi; Maharani, Titi Safitri; Darmono, Darmono; Utomo, Fandy Setyo
Jurnal Pendidikan dan Teknologi Indonesia Vol 4 No 8 (2024): JPTI - Agustus 2024
Publisher : CV Infinite Corporation

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.52436/1.jpti.602

Abstract

Penyebaran berita hoax di era digital menjadi tantangan serius yang memerlukan solusi berbasis teknologi untuk mengidentifikasi dan meminimalkan dampaknya. Penelitian ini bertujuan untuk mengevaluasi performa Logistic Regression (LR) dan Random Forest (RF) dalam mendeteksi berita hoax menggunakan representasi teks berbasis Term Frequency-Inverse Document Frequency (TF-IDF). Hyperparameter tuning diterapkan pada kedua algoritma untuk meningkatkan akurasi, precision, recall, dan F1-score. Dataset yang digunakan terdiri dari berita hoax dan valid dalam bahasa Indonesia, yang telah melalui tahapan preprocessing, termasuk pembersihan teks, penghapusan stopwords, dan stemming. Hasil evaluasi menunjukkan bahwa Logistic Regression, setelah tuning, mencapai akurasi sebesar 95.20%, precision 95.71%, recall 94.48%, dan F1-score 95.09%. Random Forest menunjukkan akurasi sebesar 92.39%, precision 94.39%, recall 89.87%, dan F1-score 92.08%. Logistic Regression unggul dalam keseimbangan antara precision dan recall, sementara Random Forest menunjukkan kekuatan pada precision dengan kemampuan menangani pola data yang lebih kompleks. Teknik TF-IDF terbukti efektif dalam memberikan bobot pada kata-kata yang relevan, membantu algoritma klasifikasi dalam mengenali pola dalam data teks. Penelitian ini juga memiliki dampak praktis dalam memberikan fondasi bagi pengembangan sistem deteksi hoax yang dapat digunakan di aplikasi berbasis NLP, baik untuk kebutuhan akademis maupun implementasi di industri. Penelitian ini berkontribusi pada pengembangan sistem deteksi hoax berbasis Natural Language Processing (NLP), khususnya untuk bahasa Indonesia. Untuk pengembangan lebih lanjut, disarankan memperluas dataset dengan sumber berita yang lebih beragam dan mengeksplorasi algoritma berbasis deep learning seperti LSTM atau Transformer. Secara ilmiah, penelitian ini memberikan kontribusi penting dengan menguji efektivitas hyperparameter tuning dalam meningkatkan akurasi model deteksi hoax. Hasil penelitian ini diharapkan dapat menjadi acuan dalam membangun sistem deteksi hoax yang lebih akurat dan andal.