Jurnal Sistem Informasi Triguna Dharma (JURSI TGD)
Vol. 4 No. 1 (2025): EDISI JANUARI 2025

Model Text Embedding dan TF-IDF+Ngram untuk Meningkatkan Kinerja Algoritma Binary Classifier pada Klasifikasi SMS Palsu

Sutriawan (Unknown)
Siti Mutmainnah (Unknown)
Teguh Ansyor Lorosae (Unknown)
Sahrul Ramadhan (Unknown)



Article Info

Publish Date
15 Jan 2025

Abstract

Seiring meningkatnya penggunaan SMS, deteksi SMS palsu (spam) menjadi tantangan dalam menjaga keamanan komunikasi. Algoritma klasifikasi berbasis teks, seperti Naive Bayes, Logistic Regression, dan Random Forest, memiliki performa yang bervariasi tergantung pada representasi fitur teks yang digunakan. Penelitian ini bertujuan untuk mengevaluasi kinerja algoritma binary classifier dalam klasifikasi SMS palsu menggunakan representasi fitur TF-IDF, TF-IDF + Ngram, dan Word2Vec. Algoritma yang diuji meliputi Naive Bayes, Logistic Regression, Random Forest, dan Decision Tree, dengan metrik akurasi, precision, recall, dan F1-score sebagai evaluasi. Hasil penelitian menunjukkan bahwa Naive Bayes dengan TF-IDF mencapai akurasi 91.26%, sementara Random Forest dengan Word2Vec memperoleh akurasi 89.08%. Logistic Regression dengan TF-IDF + Ngram menunjukkan hasil lebih rendah. Temuan ini menegaskan pentingnya pemilihan representasi fitur yang tepat untuk meningkatkan akurasi klasifikasi SMS palsu.

Copyrights © 2025






Journal Info

Abbrev

jsi

Publisher

Subject

Computer Science & IT

Description

Jurnal Sistem Informasi Triguna Dharma merupakan Jurnal yang menampung hasil penelitian dari Mahasiswa khususnya mahasiswa di Program Studi Sistem Informasi juga menerima hasil penelitian dari kampus berbeda dengan bidang keilmuan yang sama. Jurnal ini menampung publikasi dibidang ilmu komputer ...