Garuda - Garba Rujukan Digital

Jurnal Sistem Informasi Triguna Dharma (JURSI TGD)

Vol. 5 No. 2 (2026): EDISI MARET 2026

Pradesan, Iis (Unknown)
Dorie Pandora Kesuma (Unknown)

Publish Date
31 Mar 2026

Data akademik di perguruan tinggi, seperti mahasiswa, dosen, mata kuliah, kelas, dan nilai, tersebar di berbagai sumber heterogen, sehingga menimbulkan tantangan besar pada integrasi, dan standar validitas data. Kondisi ini berpotensi menghambat pelaporan, akreditasi, maupun pengambilan keputusan strategis berbasis data. Penelitian ini bertujuan merancang dan mengimplementasikan pipeline Extract, Transform, Load (ETL) berbasis big data untuk mengatasi permasalahan tersebut. Metode penelitian meliputi studi pendahuluan, pengumpulan data, pemetaan rule validasi, dan implementasi pipeline menggunakan Apache NiFi serta Hadoop Distributed File System (HDFS). Hasil implementasi menunjukkan pipeline mampu mengekstrak data multi-sumber secara otomatis, menerapkan validasi berbasis aturan (length, nullable, reference, min-max), dan memuat data tervalidasi ke cluster HDFS dengan high availability dan fault tolerance. Uji coba menemukan sekitar 8% data error berhasil diisolasi, sementara tingkat validitas data pada entitas utama mencapai lebih dari 90%. Kontribusi penelitian ini terletak pada integrasi multi sumber data akademik, penerapan standar, mekanisme otomatis penanganan data invalid, serta pemanfaatan HDFS sebagai penyimpanan terdistribusi. Pipeline yang dihasilkan dapat menjadi blueprint praktis untuk perguruan tinggi di Indonesia dalam mengukur kualitas data dan mendukung tata kelola berbasis big data.

Citation Download

EndNote, Reference Manager, ProCite

Latex, Jabref

Check in Google Scholar

Journal Info

Jurnal Sistem Informasi Triguna Dharma (JURSI TGD)

Website

Abbrev

jsi

Publisher

STMIK Triguna Dharma

Subject

Computer Science & IT

Description

Jurnal Sistem Informasi Triguna Dharma merupakan Jurnal yang menampung hasil penelitian dari Mahasiswa khususnya mahasiswa di Program Studi Sistem Informasi juga menerima hasil penelitian dari kampus berbeda dengan bidang keilmuan yang sama. Jurnal ini menampung publikasi dibidang ilmu komputer ...

Article Info

Abstract

Pipeline ETL Big Data sebagai Solusi Integrasi Data Perguruan Tinggi dengan Evaluasi Validitas Otomatis

Article Info

Abstract