Peningkatan angka kriminalitas di Indonesia berdampak pada semakin masifnya pemberitaan kejahatan di media daring. Data berita yang tidak terstruktur memerlukan pendekatan sistematis agar dapat dianalisis secara efektif. Penelitian ini bertujuan untuk mengimplementasikan proses Extract, Transform, Load (ETL) dan metode topic modeling menggunakan algoritma Latent Dirichlet Allocation (LDA) untuk mengidentifikasi topik kriminal pada artikel berita online, khususnya dari portal Detik.com. Data dikumpulkan melalui teknik web scraping, kemudian diproses melalui tahapan transformasi untuk pembersihan dan standarisasi, serta dimuat ke dalam basis data agar lebih terorganisasi. Selanjutnya, dilakukan text preprocessing dan representasi teks menggunakan Bag of Words sebelum dimodelkan dengan LDA. Hasil penelitian menunjukkan bahwa dari 4.105 artikel kriminal, diperoleh 7 topik utama, yaitu pencurian dan kekerasan fisik, kejahatan seksual dan kekerasan anak, kejahatan politik dan pelanggaran HAM, kekerasan bersenjata dan separatisme, kejahatan finansial dan narkotika, pembunuhan dan penganiayaan, serta pelanggaran hukum dan penyalahgunaan wewenang. Analisis tren menunjukkan dua topik dominan sepanjang periode penelitian, yakni pencurian serta kejahatan seksual. Temuan ini menegaskan pentingnya integrasi ETL dan LDA untuk memahami pola kriminalitas secara sistematis, serta dapat menjadi dasar pengambilan kebijakan berbasis data.