Decode: Jurnal Pendidikan Teknologi Informasi
Vol. 6 No. 1: MARET 2026

Arsitektur Data Pipeline Otomatis Berbasis Python untuk Scraping X (Twitter): Studi Kasus Program Makan Bergizi Gratis

Septiana, Kharisma Alya (Unknown)
Firdonsyah, Arizona (Unknown)



Article Info

Publish Date
31 Mar 2026

Abstract

Media sosial X (Twitter) merupakan sumber data penting untuk analisis opini publik, namun pembatasan akses API sejak 2023 menghambat pengumpulan data berskala besar secara berkelanjutan. Kondisi tersebut mendorong penggunaan web scraping sebagai alternatif. Penelitian ini bertujuan merancang dan mengevaluasi arsitektur data pipeline berbasis ETL (Extract, Transform, Load) yang terotomatisasi dan terjadwal, dengan studi kasus Program Makan Bergizi Gratis (MBG). Pipeline diorkestrasi menggunakan Prefect, melakukan ekstraksi data melalui Tweet Harvest berbasis kata kunci, transformasi melalui pembersihan dan standarisasi data, serta penyimpanan ke basis data relasional MySQL dengan dukungan monitoring dan notifikasi otomatis. Hasil menunjukkan pipeline berjalan stabil selama tujuh hari pengujian dengan total 8.662 data mentah dan 6.377 data hasil pembersihan. Uji kualitas data menghasilkan nilai precision sebesar 95,5%, menunjukkan relevansi tinggi terhadap topik penelitian. Uji performa menunjukkan penggunaan sumber daya rendah dengan rata-rata CPU 0,50% dan RAM 146,34 MB. Dengan demikian, arsitektur pipeline ETL otomatis berbasis Python efektif untuk pengumpulan data media sosial secara terstruktur, efisien, dan berkelanjutan sebagai alternatif keterbatasan akses API platform X.

Copyrights © 2026






Journal Info

Abbrev

decode

Publisher

Subject

Computer Science & IT Control & Systems Engineering Education Languange, Linguistic, Communication & Media Other

Description

DECODE: Jurnal Pendidikan Teknologi Informasi publishes articles in English and Indonesian which will be published 3 times a year, namely March, July and November. Articles that can be considered for publication in this journal are the results of research that is in accordance with the focus and ...