Claim Missing Document
Check
Articles

Found 3 Documents
Search

Analisis Teknik Embedding Model NV-Embed pada Large Language Models Berbasis Retrieval Augmented Generation Rahardiansyah, Tengku Muhammad Rafi; Rizal Setya Perdana; Tirana Noor Fatyanosa
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer Vol 9 No 2 (2025): Februari 2025
Publisher : Fakultas Ilmu Komputer (FILKOM), Universitas Brawijaya

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Large Language Models (LLMs) berbasis Retrieval-Augmented Generation (RAG) menghadirkan tantangan dalam menghasilkan embedding yang akurat untuk meningkatkan performa retrieval dan generasi teks. NV-Embed adalah model embedding baru yang dirancang untuk mengatasi keterbatasan model embedding sebelumnya dengan pendekatan latent attention dan pelatihan contrastive instruction-tuning. Penelitian ini dilakukan dengan melakukan implementasi NV-Embed menggunakan bantuan PyTorch. Dokumen PDF diolah melalui tahap pre-processing, tokenization dan vectorization. Dokumen PDF yang telah diolah dan disimpan didalam vector database akan digunakan sebagai referensi untuk memperkaya hasil response berdasarkan informasi yang tersedia pada LLM dan informasi dari dokumen PDF yang didapatkan melalui RAG pipeline. Teknik embedding NV-Embed dievaluasi menggunakan metrik precision, recall, F1-score untuk retrieval, serta BLEU dan ROUGE untuk generasi teks. Hasil pengujian menunjukkan bahwa NV-Embed unggul dalam tugas retrieval dengan tingkat precision sebesar 0.906, recall sebesar 0.994, dan f1-score sebesar 0.948. Pada tugas generasi teks, NV-Embed mencapai hasil BLEU sebesar 0.899 dan metrik ROUGE juga menunjukkan hasil yang sangat baik, dengan ROUGE-1 sebesar 0.955, ROUGE-2 sebesar 0.951, dan ROUGE-L sebesar 0.955. Analisis terhadap performa NV-Embed menunjukkan bahwa pendekatan latent attention meningkatkan kualitas embedding dalam menangkap hubungan semantik antar kata. Penelitian ini memberikan kontribusi penting terhadap pengembangan model embedding dalam LLMs berbasis RAG dan membuka peluang untuk penelitian lebih lanjut.
Penyaringan Informasi Sensitif pada Sistem Chatbot Berbasis Retrieval Augmented Generation dengan Metode Named Entity Recognition Wicaksana, Kesid Dewa; Rizal Setya Perdana; Tirana Noor Fatyanosa
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer Vol 9 No 3 (2025): Maret 2025
Publisher : Fakultas Ilmu Komputer (FILKOM), Universitas Brawijaya

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Retrieval Augmented Generation (RAG) telah berkembang sebagai pendekatan inovatif dalam chatbot dengan menggabungkan Large Language Models (LLMs) dan sumber pengetahuan eksternal. Namun, tantangan besar muncul terkait kebocoran informasi sensitif, khususnya dalam aplikasi yang membutuhkan perlindungan privasi. Penelitian ini mengembangkan chatbot berbasis RAG dengan penyaringan informasi sensitif menggunakan Named Entity Recognition (NER). Model DistilBERT yang telah di-fine-tune untuk tugas NER pada dataset sintetis, diimplementasikan untuk mengenali entitas sensitif seperti nama, alamat, dan nomor identitas. Proses penelitian mencakup pengembangan pipeline RAG, integrasi model NER, serta evaluasi kinerja dengan metrik precision, recall, dan f-measure. Hasil menunjukkan performa tinggi dari model fine-tuned DistilBERT, dengan precision 0,965, recall 0,965, dan f-measure 0,965 pada evaluasi weighted average. Meskipun pipeline RAG memiliki performa lebih rendah, dengan precision 0,71, recall 0,92, dan f-measure 0,79, hasilnya tetap menunjukkan kemampuan memadai dalam menyaring informasi sensitif. Evaluasi ini mencerminkan potensi implementasi sistem chatbot berbasis RAG yang lebih aman dan efisien dalam menjaga privasi data pengguna.
Analisis Kinerja Transfer Learning Pada Model YOLO Dan PaddleOCR Dalam Deteksi Dan Pengenalan Plat Nomor Kendaraan Ais Azra Azhari; Tirana Noor Fatyanosa; Santoso, edy
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer Vol 9 No 10 (2025): Oktober 2025
Publisher : Fakultas Ilmu Komputer (FILKOM), Universitas Brawijaya

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Sistem Automatic License Plate Recognition (ALPR) sangat esensial dalam berbagai aplikasi transportasi cerdas dan keamanan. Namun, implementasi ALPR tradisional sering menghadapi tantangan signifikan seperti variasi bentuk plat nomor, kondisi pencahayaan, dan sudut pengambilan gambar. Penelitian ini mengatasi masalah tersebut dengan menganalisis kinerja transfer learning pada model deep learning YOLOv8 untuk deteksi plat nomor dan PaddleOCR untuk pengenalan karakter, memanfaatkan dataset plat nomor kendaraan Indonesia yang komprehensif. Metodologi penelitian melibatkan pra-pemrosesan dataset dan fine-tuning pada model. YOLOv8 bertanggung jawab mendeteksi lokasi plat nomor kendaraan, dan area yang terdeteksi kemudian diekstraksi serta diproses oleh PaddleOCR untuk pengenalan karakter. Evaluasi kinerja sistem dilakukan secara ekstensif menggunakan metrik standar seperti Precision, Recall, F1-score, dan mean Average Precision (mAP) untuk deteksi, serta Character Recognition Rate (CRR), License Plate Recognition Rate (LPRR), dan Edit Distance untuk pengenalan karakter. Hasil penelitian menunjukkan fine-tuning YOLOv8 sangat efektif, mencapai mAP50 99.31%, Precision 98.06%, Recall 97.77%, dan F1-score 97.91%, dengan konvergensi cepat (15-20 epoch). PaddleOCR mencapai CRR 84.20% dan LPRR 71.40%, dengan kesalahan minor. Pendekatan transfer learning ini terbukti efisien dan efektif dalam membangun sistem ALPR yang akurat dan adaptif untuk konteks plat nomor Indonesia.