Penelitian ini bertujuan untuk mencari fitur ekstraksi terbaik serta menerapkan pemodelan topik dari data Twitter tentang kebocoran data pribadi, salah satu trending topik akibat ulah oknum hacker bjorka dimana data yang tersebar merupakan data penting seperti NIK dan SIM Card rakyat Indonesia. Penelitian dilakukan dengan metode Latent Dirichlet Allocation (LDA) menggunakan fitur ekstraksi Bag of Word (BoW) dan TF-IDF, dan data yang digunakan terdiri dari 11.067 tweet dari platform twitter. Pemodelan dengan menggunakan fitur ekstraksi BoW menghasilkan score coherences terbaik bernilai 0.47 dengan 3 topik utama terkait kebocoran data seperti kominfo lindungi data pribadi, johnny g plate bertanggung jawab atas kasus kebocoran data ulah hacker bjorka dan perlindungan data pribadi rakyat memalui ruu pdp. Sementara itu, dengan fitur ekstraksi TF-IDF mendapatkan score coherences terbaik bernilai 0.47 dengan 5 topik utama, akan tetapi topik tersebut tidak dapat di interpretasikan dengan baik seperti menggunakan fitur ekstraksi BoW.
Copyrights © 2024