Claim Missing Document
Check
Articles

A Systematic Review of Retrieval-Augmented Generation for Enhancing Domain-Specific Knowledge in Large Language Models Murtiyoso, Murtiyoso; Tahyudin, Imam; Berlilana, Berlilana
Sinkron : jurnal dan penelitian teknik informatika Vol. 9 No. 2 (2025): Research Articles April 2025
Publisher : Politeknik Ganesha Medan

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.33395/sinkron.v9i2.14824

Abstract

This literature review examines the use of Retrieval-Augmented Generation (RAG) in enhancing Large Language Models (LLM) for domain-specific knowledge. RAG integrates retrieval techniques with generative models to access external knowledge sources, addressing the limitations of LLMs in handling specialized information. By leveraging external data, RAG improves the accuracy and relevance of generated content, making it particularly useful in fields that require detailed and up-to-date knowledge. This review highlights the effectiveness of RAG in overcoming challenges such as data sparsity and the dynamic nature of specialized knowledge. Furthermore, it discusses the potential of RAG to enhance LLM performance, scalability, and the ability to generate contextually accurate responses in knowledge-intensive applications. Key challenges and future research directions in the implementation of RAG for domain-specific knowledge are also identified.
Analisis Validitas dan Reliabilitas Kuesioner dengan Metode Partial Least Squares Structural Equation Modeling pada Aplikasi SMARTPLS Yarsasi, Sri; Tahyudin, Imam; Hariguna, Taqwa
Jurnal Pendidikan dan Teknologi Indonesia Vol 5 No 7 (2025): JPTI - Juli 2025
Publisher : CV Infinite Corporation

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.52436/1.jpti.885

Abstract

Validitas dan reliabilitas instrumen merupakan aspek krusial dalam penelitian kuantitatif, karena kualitas pengukuran yang rendah dapat menghasilkan data yang tidak akurat dan mengarah pada kesimpulan yang menyesatkan. Penelitian ini bertujuan untuk mengevaluasi kualitas pengukuran instrumen kuesioner menggunakan pendekatan Partial Least Squares Structural Equation Modeling (PLS-SEM) dengan bantuan perangkat lunak SmartPLS. Metode ini dipilih karena mampu menangani model yang kompleks dan data yang tidak memenuhi asumsi normalitas. Hasil analisis menunjukkan bahwa sebagian besar indikator memiliki nilai outer loading di atas 0,70, nilai Composite Reliability (CR) berada dalam rentang 0,817 hingga 0,914, dan nilai Average Variance Extracted (AVE) melebihi 0,50, yang menunjukkan bahwa instrumen memiliki konsistensi internal dan validitas konvergen yang baik. Namun demikian, terdapat dua indikator dengan nilai outer loading di bawah ambang batas, yaitu X3.2 sebesar 0,612 dan Y2.4 sebesar 0,588, yang perlu dievaluasi ulang. Temuan ini menegaskan bahwa pendekatan PLS-SEM efektif untuk memvalidasi instrumen, terutama dalam penelitian dengan sampel terbatas dan desain eksploratori. Studi ini memberikan kontribusi metodologis terhadap pengembangan instrumen penelitian yang lebih akurat dan adaptif, serta menunjukkan urgensi penggunaan pendekatan statistik modern dalam evaluasi instrumen di berbagai bidang keilmuan.
Enhancing Accessibility in Local Government Data Portals via Retrieval- Augmented Generation: A Case Study on Satu Data Indonesia in Banyumas Regency Hadie, Agus Nur; Tahyudin, Imam; Hariguna, Taqwa
Jurnal Teknik Informatika (Jutif) Vol. 6 No. 4 (2025): JUTIF Volume 6, Number 4, Agustus 2025
Publisher : Informatika, Universitas Jenderal Soedirman

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.52436/1.jutif.2025.6.4.5153

Abstract

Public access to local government data in Indonesia, such as that in the Satu Data Indonesia portal for Banyumas Regency, is severely hampered by outdated search interfaces and the technical complexity of handling heterogeneous data formats like PDF, Excel, and CSV. This research directly addresses this accessibility gap by designing, developing, and evaluating an intelligent question-answering system. We introduce a novel application of a Retrieval- Augmented Generation (RAG) architecture tailored for Indonesian local government data. The core novelty lies in our methodology for handling heterogeneous data formats (PDF, Excel, CSV) by integrating a low-code orchestrator (n8n) with a high-performance vector database (pgvector), a practical solution for a common public sector challenge. The system utilizes the text-embedding-3-large model for semantic understanding and gpt-4.1 for generating grounded, factual answers. The system's effectiveness was rigorously validated, achieving a perfect 100% score across accuracy, precision, recall, and F1-score on defined test cases. Crucially, usability testing with end-users confirmed the system is perceived as significantly more efficient and user-friendly than manual data searching. The primary impact of this work is a validated, replicable blueprint for local governments to democratize public information. By transforming complex data retrieval into an intuitive conversation, this research offers a practical AI solution to enhance governmental transparency and citizen engagement.
Klasifikasi Edibilitas Jamur Secara Otomatis Menggunakan  Algoritma Random Forest Berbasis Morfologi Pahlevi, Muhammad Reza; Tahyudin, Imam; Tikaningsih, Ades
Jurnal Sistem Informasi Vol. 12 No. 2 (2025)
Publisher : Universitas Serang Raya

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.30656/jsii.v12i2.10868

Abstract

Jamur merupakan organisme yang memiliki keragaman morfologi yang tinggi, namun beberapa jenis di antaranya bersifat beracun dan membahayakan jika dikonsumsi. Kesamaan ciri fisik antara jamur yang dapat dimakan dan yang beracun sering kali menyulitkan proses identifikasi secara manual. Penelitian ini bertujuan mengembangkan sistem klasifikasi otomatis berbasis algoritma Random Forest untuk membedakan jamur edible dan poisonous, memanfaatkan seluruh 21 atribut (18 kategorikal, 3 numerik) dari dataset komprehensif Kaggle (61.069 entri). Metodologi penelitian mengikuti alur CRISP-DM yang dimodifikasi, dimulai dari pengumpulan data hingga implementasi. Tahap pra-pemrosesan data krusial dilakukan secara ekstensif, meliputi penanganan duplikasi data dan imputasi missing value (menggunakan median dan modus). Selanjutnya, transformasi label kelas (edible=0, poisonous=1) dan One-Hot Encoding diterapkan pada fitur kategorikal untuk representasi numerik yang tepat. Fitur numerik seperti cap-diameter dan stem-height dinormalisasi menggunakan Standard Scaling untuk menyeimbangkan kontribusi. Data kemudian dibagi 80:20 untuk pelatihan dan pengujian. Model Random Forest dikembangkan dengan parameter optimal (n_estimators=200, max_depth=15, class_weight="balanced") untuk efisiensi dan robustabilitas terhadap ketidakseimbangan kelas. Hasil evaluasi menunjukkan performa sangat baik dengan akurasi keseluruhan 99,34%, serta nilai precision, recall, dan f1-score yang seimbang pada 0.99 untuk kedua kelas. Analisis feature importance mengidentifikasi stem-width, stem-height, dan cap-diameter sebagai atribut paling berpengaruh. Learning curve menunjukkan stabilitas model tanpa overfitting. Implementasi pada sampel jamur baru juga mengkonfirmasi kemampuan prediksi yang konsisten, menjadikan model ini layak sebagai sistem pendukung keputusan otomatis dalam deteksi jamur beracun.
Pelatihan Video Editing dan Pembuatan Konten Digital PCINU Jepang sebagai Media Dakwah Tahyudin, Imam; Arifudin, Dani; Rozaq, Hasri Akbar Awal; Putra, Feishal Azriel Arya
Jurnal Pengabdian Masyarakat Progresif Humanis Brainstorming Vol 6, No 1 (2023): Jurnal Abdimas PHB : Jurnal Pengabdian Masyarakat Progresif Humanis Brainstormin
Publisher : Politeknik Harapan Bersama

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.30591/japhb.v6i1.4231

Abstract

Jumlah warga Indonesia yang tinggal di Jepang dan aktif di PCINU Jepang lebih dari 300 orang. PCINU Jepang memiliki banyak program kerja dalam rangka mensyiarkan Islam berhaluan ahli sunah wal jamaah ala Nahdlatul Ulama (NU). Sebagai Langkah kolaborasi untuk mengoptimalkan program kerja tersebut, PCINU jepang bekerjasama dengan Universitas Amikom Purwokerto. Bentuk implementasi Kerjasama tersebut dalam wujud pembekalan keterampilan kemampuan editing video dan pembuatan konten digital sebagai media dakwah melalui media sosial untuk pengurus dan anggota PCINU Jepang. Kemampuan tentang editing video dan pembuatan konten digital dirasa sangat diperlukan saat ini di era digital. Pelatihan ini diadakan secara daring dan pendampingan melalui group media sosial seperti WhatsApp (WA). Pelatihan terlaksana sukses berkat kerjasama banyak pihak khususnya panitia, pemateri dan peserta. Jumlah peserta yang mengikuti acara tersebut sebanyak 30 orang dari banyak daerah di Jepang dengan beraneka ragam latar belakang pendidikan dan pekerjaan. Hasil evaluasi menunjukan adanya peningkatan pemahaman dan keahlian editing video dan pembuatan konten digital antara sebelum dan sesudah mengikuti pelatihan. Pelatihan ini telah dipublikasikan pada media massa cetak Radar Banyumas, serta video kegiatan yang dapat diakses secara publik melalui saluran Youtube. Untuk tahun selanjutnya akan diadakan proses pendampingan untuk optimalisasi website PCINU Jepang.
Analisis Performa Model Deep Learning dalam Deteksi Penyakit Mata: Studi CNN, RNN, dan FNN Rizaqi, Hanif; Tahyudin, Imam
InComTech : Jurnal Telekomunikasi dan Komputer Vol 15, No 2 (2025)
Publisher : Department of Electrical Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.22441/incomtech.v15i2.31261

Abstract

Penyakit mata menjadi salah satu penyebab utama gangguan penglihatan yang dapat mengarah pada kebutaan permanen jika tidak ditangani dengan baik. Beberapa penyakit mata yang sering terjadi antara lain katarak, glaukoma, dan retinopati diabetik. Penelitian ini bertujuan untuk mengembangkan model klasifikasi penyakit mata berbasis citra menggunakan tiga metode deep learning, yaitu Convolutional Neural Network (CNN), Recurrent Neural Network (RNN), dan Feedforward Neural Network (FNN). Dataset yang digunakan dalam penelitian ini terdiri dari 4.217 citra, yang diproses melalui tahapan preprocessing yang mencakup pembagian data menjadi tiga kelompok: pelatihan (training), validasi, dan pengujian (testing). Selanjutnya, citra tersebut melalui tahap resizing dan normalisasi untuk meningkatkan kualitas data yang digunakan dalam pelatihan model. Model-model yang dikembangkan kemudian dilatih menggunakan teknik Early Stopping untuk mencegah overfitting dan mengoptimalkan performa. Berdasarkan hasil evaluasi, model CNN menunjukkan performa terbaik dengan akurasi uji sebesar 85% dan nilai loss 0, 3841, mengungguli RNN yang memiliki akurasi 83% dan FNN dengan akurasi 78%. Selain itu, analisis menggunakan Confusion Matrix menunjukkan bahwa CNN lebih unggul dalam menangkap fitur spasial pada citra dibandingkan model lainnya. Implementasi model dilakukan dalam aplikasi web berbasis Flask untuk memprediksi penyakit mata berdasarkan citra yang diunggah pengguna. Penelitian lanjutan dapat meningkatkan akurasi model dengan menerapkan transfer learning menggunakan model pretrained yang lebih kompleks.
Impact of NLP Algorithms on Sentiment Analysis Efficiency and Accuracy Triawan, Puas; Tahyudin, Imam; Purwadi, Purwadi
Journal of Information System and Informatics Vol 7 No 3 (2025): September
Publisher : Universitas Bina Darma

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.51519/journalisi.v7i3.1222

Abstract

Sentiment analysis plays a crucial role in understanding user perceptions of products and services in the digital era. However, its implementation is still constrained by the need for high computational resources. This research aims to evaluate the impact of implementing transformer-based Natural Language Processing (NLP) algorithms—such as BERT, RoBERTa, and ELECTRA—on the quality and efficiency of sentiment analysis, especially in multilingual and real-time data contexts. This study uses a Systematic Literature Review (SLR) approach with the PRISMA protocol to assess the performance, challenges, and solutions offered by various NLP models. The study results show that transformer-based models consistently outperform traditional approaches; BERT and RoBERTa can achieve accuracy above 95% with F1-scores ranging from 0.92–0.95, while ELECTRA records the highest accuracy up to 98.09% with average precision and recall above 0.90 on e-commerce data. Furthermore, the transfer learning approach has been proven to reduce training time by 50–70% compared to conventional methods, without compromising analysis quality. Nevertheless, the need for large computational power remains a major obstacle. Several strategies, such as model distillation and data augmentation, have proven effective in reducing computational load while maintaining high performance. These findings confirm that transformer-based NLP technology not only improves the quality of sentiment analysis but also opens up innovation opportunities for cross-language and cross-domain applications. This research recommends optimizing models for resource-constrained languages and developing real-time systems to achieve inclusivity and efficiency in modern data processing.
Hyperparameter Optimization Of IndoBERT Using Grid Search, Random Search, And Bayesian Optimization In Sentiment Analysis Of E-Government Application Reviews Iskoko, Angga; Tahyudin, Imam; Purwadi, Purwadi
Jurnal Teknik Informatika (Jutif) Vol. 6 No. 5 (2025): JUTIF Volume 6, Number 5, Oktober 2025
Publisher : Informatika, Universitas Jenderal Soedirman

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.52436/1.jutif.2025.6.5.4897

Abstract

User reviews on Google Play Store reflect satisfaction and expectations regarding digital services, including E-Government applications. This study aims to optimize IndoBERT performance in sentiment classification through fine-tuning and hyperparameter exploration using three methods: Grid Search, Random Search, and Bayesian Optimization. Experiments were conducted on Sinaga Mobile app reviews, evaluated using accuracy, precision, recall, F1-score, learning curve, and confusion matrix. The results show that Grid Search with a learning rate of 5e-5 and a batch size of 16 provides the best results, with an accuracy of 90.55%, precision of 91.16%, recall of 90.55%, and F1-score of 89.75%. The learning curve indicates stable training without overfitting. This study provides practical contributions as a guide for improving IndoBERT in Indonesian sentiment analysis and as a foundation for developing NLP-based review monitoring systems to enhance public digital services.
Perbandingan Algoritma Support Vector Machine, Decision Tree, dan Logistic Regresion Pada Analisis Sentimen Ulasan Aplikasi Netflix Ramadani, Nevita Cahaya; Tahyudin, Imam; Shouni Barkah, Azhari
Jurnal Nasional Teknologi dan Sistem Informasi Vol 10 No 2 (2024): Agustus 2024
Publisher : Departemen Sistem Informasi, Fakultas Teknologi Informasi, Universitas Andalas

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.25077/TEKNOSI.v10i2.2024.110-117

Abstract

Penelitian ini bertujuan untuk menganalisis sentimen terhadap ulasan pengguna Netflix menggunakan algoritma machine learning seperti Support Vector Machine (SVM), Decision Tree dan Logistic Regression. Dataset yang terdiri dari 3000 ulasan pengguna diambil dari Google Play Store dan melalui proses preprocessing teks yang mencakup penghapusan karakter, tokenisasi, penghapusan stopword, stemming, serta penyaringan token pendek. Metode TF-IDF digunakan untuk ekstraksi dan pembobotan fitur dalam analisis. Evaluasi hasil menunjukkan bahwa SVM secara konsisten memberikan akurasi yang lebih tinggi dibandingkan Decision Tree dan Logistic Regression dalam klasifikasi sentimen, dengan SVM mencapai akurasi rata-rata 88.18% dan puncak tertinggi 92.69% dalam K-Fold Cross Validation. Implikasi praktis dari penelitian ini adalah Netflix dapat memanfaatkan analisis sentimen untuk meningkatkan pengalaman pengguna dan pengelolaan layanan lebih baik.
Co-Authors Agustina, Nur Ngaenun Al-Haq, Ahnaf Vanning Al-Haq Alam, Yusuf Nur Alfirnanda, Weersa Talta Ammar Fauzan, Ammar Ananda, Fahesta Ananda, Rona Sepri Andrianto Andrianto Anggraini, Lintang Wahyu ANNISA HANDAYANI Anton Satria Prabuwono Arifa, Pujana Nisya Aris Munandar Azhari Shouni Barkah Bayu Surarso Berlilana Berlilana Che Pee, Ahmad Naim Daffa, Nauffal Ammar Dani Arifudin Dhanar Intan Surya Saputra Diniyati, Faoziyah Fahiya Eko Priyanto Eko Winarto Evania Adna Faiz Ichsan Jaya Fajariyanti, Alya Nur Fandy Setyo Utomo Fatmawati, Karlina Diah Febryanto, Bagas Aji Fitriani, Intan Indri Giat Karyono Hadie, Agus Nur Hellik Hermawan Hermanto, Aldy Agil Hidayah, Septi Oktaviani Nur Ilham, Rifqi Arifin Irfan Santiko Iskoko, Angga Isnaini, Khairunnisak Nur Khoerida, Nur Isnaeni khusnul khotimah Kuat Indartono Kusuma, Bagus Adhi Lestari, Silvia Windri Ma'arifah, Windiya Maulida, Trisna Melia Dianingrum Miftahus Surur, Miftahus Muhammad Reza Pahlevi Murtiyoso Murtiyoso Musyafa, Muhamad Fahmi Nabila, Putri Isma Nanjar, Agi Nazwan, Nazwan Nur Faizah Nur holifah, Anggita Oyabu, Takashi Prasetya, Subani Charis Prastyo, Priyo Agung PUJI LESTARI Purwadi Purwadi Purwadi Purwadi Putra, Bernardus Septian Cahya Putra, Feishal Azriel Arya R Rizal Isnanto Rahayu, Dania Gusmi Rahma, Felinda Aprilia Ramadani, Nevita Cahaya Rizaqi, Hanif Rozak, Rofik Abdul Rozak, Rofiq 'Abdul Rozak, Rofiq Abdul Rozak, Rofiq ‘Abdul Rozaq, Hasri Akbar Awal Saefullah, Ufu Samsul Samsul Arifin Santoso, Bagus Budi Sarmini Sarmini Satriani, Laela Jati Setiabudi, Rizki Sholikhatin, Siti Alvi Syafaat, Alif Yahya Syafiq, Bayu Ibnu Taqwa Hariguna Tikaningsih, Ades Tri Retnaningsih Soeprobowati Triana, Latifah Adi Triawan, Puas Wahyudin, Widya Cholid Wardani, Syafa Wajahtu Widiawati, Neta Tri Wini Audiana Wulandari, Hendita Ayu Yarsasi, Sri Zainal Arifin Hasibuan Zulfa Ummu Hani Zumaroh, Agnis Nur Afa