Nadya Lestari
Universitas Tanjungpura

Published : 1 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 1 Documents
Search

Penerapan Seleksi Fitur Particle Swarm Optimization pada Klasifikasi Teks (Studi Kasus: Komentar Cyberbullying Instagram) Nadya Lestari; Tursina Tursina; Enda Esyudha Pratama
JEPIN (Jurnal Edukasi dan Penelitian Informatika) Vol 9, No 2 (2023): Volume 9 No 2
Publisher : Program Studi Informatika

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/jp.v9i2.68320

Abstract

Dunia saat ini sedang berada di era Big Data, dimana sejumlah besar data berdimensi tinggi tersebar di berbagai domain, seperti media sosial, layanan kesehatan, bio-informatika, dan pendidikan online. Big Data adalah salah satu teknik pembelajaran mesin dan menjadi alat penting yang populer dalam bisnis, sehingga pengelolaan Big Data yang efektif menjadi hal yang sangat penting. Salah satu topik yang menarik untuk diteliti dalam kajian Big Data khususnya text mining ialah cyberbullying Instagram. Beberapa teknik yang dapat digunakan untuk memecahkan masalah text mining yaitu, clustering, klasifikasi, outlier, asosiasi, dan masih banyak lagi. Klasifikasi merupakan bentuk dasar dari analisis data yang banyak diterapkan diberbagai bidang. Penelitian ini membangun model klasifikasi menggunakan algoritma Logistic Regression dengan penambahan proses seleksi fitur menggunakan algoritma Particle Swarm Optimization sebagai tahapan yang berada sebelum proses pelatihan model regresi untuk mengklasifikasi komentar cyberbullying Instagram. Seleksi fitur dilakukan untuk mempertahankan kinerja model klasifikasi dengan menggunakan jumlah fitur pelatihan yang lebih sedikit. Hasil penelitian menunjukkan bahwa penambahan seleksi fitur dapat mereduksi fitur kata sebanyak 40% yang diikuti penurunan akurasi, presisi, dan AUC masing-masing sebesar  1,25%, 4,25%, 1,09% serta peningkatan nilai recall dan f1-score secara berurut sebesar 5,36% dan 0,57%. Penambahan Particle Swarm Optimization sebagai seleksi fitur pada kasus  disimpulkan efektif mempertahankan kinerja pembelajaran model dilihat dari nilai AUC yang tetap berada pada kategori Good Classification saat dilatih dengan fitur kata yang lebih sedikit.