Kamila, Ahista Tasya
Unknown Affiliation

Published : 1 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 1 Documents
Search

IMPLEMENTASI ETL DAN TOPIC MODELING MENGGUNAKAN ALGORITMA LATENT DIRICHLET ALLOCATION UNTUK IDENTIFIKASI TOPIK KRIMINAL PADA BERITA ONLINE Medistarani, Ririn; Kamila, Ahista Tasya; Pradana, Bintang Ary; Sarwanti, Ruth Tika; Rozikin, Chaerur
Jurnal Informatika dan Teknik Elektro Terapan Vol. 13 No. 3S1 (2025)
Publisher : Universitas Lampung

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.23960/jitet.v13i3S1.8041

Abstract

Peningkatan angka kriminalitas di Indonesia berdampak pada semakin masifnya pemberitaan kejahatan di media daring. Data berita yang tidak terstruktur memerlukan pendekatan sistematis agar dapat dianalisis secara efektif. Penelitian ini bertujuan untuk mengimplementasikan proses Extract, Transform, Load (ETL) dan metode topic modeling menggunakan algoritma Latent Dirichlet Allocation (LDA) untuk mengidentifikasi topik kriminal pada artikel berita online, khususnya dari portal Detik.com. Data dikumpulkan melalui teknik web scraping, kemudian diproses melalui tahapan transformasi untuk pembersihan dan standarisasi, serta dimuat ke dalam basis data agar lebih terorganisasi. Selanjutnya, dilakukan text preprocessing dan representasi teks menggunakan Bag of Words sebelum dimodelkan dengan LDA. Hasil penelitian menunjukkan bahwa dari 4.105 artikel kriminal, diperoleh 7 topik utama, yaitu pencurian dan kekerasan fisik, kejahatan seksual dan kekerasan anak, kejahatan politik dan pelanggaran HAM, kekerasan bersenjata dan separatisme, kejahatan finansial dan narkotika, pembunuhan dan penganiayaan, serta pelanggaran hukum dan penyalahgunaan wewenang. Analisis tren menunjukkan dua topik dominan sepanjang periode penelitian, yakni pencurian serta kejahatan seksual. Temuan ini menegaskan pentingnya integrasi ETL dan LDA untuk memahami pola kriminalitas secara sistematis, serta dapat menjadi dasar pengambilan kebijakan berbasis data.