Jurnal Ilmiah Informatika Komputer
Vol 27, No 2 (2022)

IDENTIFIKASI TOPIK ARTIKEL BERITA MENGGUNAKAN TOPIC MODELLING DENGAN LATENT DIRICHLET ALLOCATION

Vira Faradhiba Rusdhi (Gunadarma University)
Ilmiyati Sari (Gunadarma University)



Article Info

Publish Date
20 Sep 2022

Abstract

Portal berita memberikan informasi yang sangat beragam, namun judul berita tidak dapat dijadikan acuan utama dalam penentuan topik suatu berita secara keseluruhan karena judul berita  bersifat  hipebola untuk menarik pembaca. Oleh karena itu, penelitian ini  mengusulkan sistem identifikasi topik artikel berita menggunakan topic modelling dengan algoritma Latent Dirichlet Allocation (LDA). Tahapan penelitian diawali dengan pengambilan data secara otomatis dari situs web detik.com dan tempo.co dengan proses web scrapping, kemudian dilakukan preprocessing terhadap data. Ada 4 tahap preprocessing yaitu tokenization, case folding, stopword removal, dan stemming. Tahap terakhir adalah topic modelling dengan algoritma LDA. Topic modelling merupakan model statistik untuk menentukan inti atau topik pada kumpulan dokumen. Identifikasi  topik dengan algoritma LDA  didasarkan pada probabilitas kemunculan kata dalam kumpulan dokumen. Penelitian ini menghasilkan topik yang paling sering muncul dalam portal berita kriminal adalah pembunuhan

Copyrights © 2022






Journal Info

Abbrev

infokom

Publisher

Subject

Computer Science & IT Decision Sciences, Operations Research & Management

Description

This journal is published periodically three times a year, April, August, and December. It publishes a broad range of research articles on Information Technology and Communication, whether in Indonesian Language or ...