Garuda - Garba Rujukan Digital

Article Per Year (5 Year)

p-Index From 2021 - 2026

0.23

P-Index

This Author published in this journals

All Journal Jurnal Informatika Polinema (JIP)

Rustian, Rafi Saumi

Unknown Affiliation

Author-ID : 9391478

Computer Science & IT Control & Systems Engineering Decision Sciences, Operations Research & Management Electrical & Electronics Engineering Library & Information Science

Published : 1 Documents Claim Missing Document

Claim Missing Document

Articles

Studi Empiris BART untuk Abstraksi Teks Semi-Struktural Domain SIPAKAT AIR Rustian, Rafi Saumi; Setyawan, Muhammad Yusril Helmi
Jurnal Informatika Polinema Vol. 12 No. 1 (2025): Vol. 12 No. 1 (2025)
Publisher : UPT P2M State Polytechnic of Malang

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.33795/jip.v12i1.8285

SIPAKAT AIR (Sistem Informasi dan Pelaporan Bidang Sumber Daya Air)) merupakan sistem informasi pemerintah daerah yang mencatat data proyek infrastruktur sumber daya air dalam format semi-struktural, yaitu gabungan antara elemen tabular dan uraian naratif. Format ini menyulitkan proses peringkasan otomatis karena tidak sepenuhnya terstruktur maupun bebas, sehingga memerlukan pendekatan yang adaptif dan semantik. Penelitian ini menyajikan studi empiris pengembangan model abstractive summarization berbasis BART yang dibangun dan dilatih dari awal (from scratch) menggunakan dataset SIPAKAT AIR. Dataset terdiri atas 200 pasangan teks dan ringkasan yang dikonstruksi dari proyek aktual. Tokenizer khusus dilatih menggunakan pendekatan ByteLevelBPETokenizer untuk mencerminkan struktur kalimat teknis dalam korpus internal. Model BART dikonfigurasi ringan (2-layer encoder-decoder) dan dilatih menggunakan Trainer API dari Huggingface. Evaluasi menggunakan metrik ROUGE, BERTScore, dan token-level menunjukkan performa kompetitif: ROUGE-1 F1 sebesar 0,5080, ROUGE-L F1 sebesar 0,5082, BERTScore F1 sebesar 0,81, serta token-level F1 sebesar 0,73 dengan akurasi 0,71. Model mampu menghasilkan ringkasan padat dan kontekstual, sesuai digunakan untuk sistem notifikasi atau tampilan ringkas pada dashboard proyek. Kontribusi metodologis dari penelitian ini mencakup perancangan pipeline summarization dari nol untuk bahasa Indonesia serta pembuktian bahwa arsitektur ringan dapat berfungsi optimal pada domain terbatas. Penelitian ini memberikan kontribusi pada pengembangan NLP dalam bahasa Indonesia serta membuka peluang penerapan adaptif untuk data semi-struktural sektor publik.

Co-Authors Setyawan, Muhammad Yusril Helmi

Title

Found 1 Documents
Search

Abstract

Title Search

Found 1 Documents Search

Abstract

Title

Found 1 Documents
Search