Claim Missing Document
Check
Articles

Found 22 Documents
Search

Implementasi Chatbot Menggunakan Long Short Term Memory (LSTM) dengan Pendekatan Retrieval-Based Azzam, Ja'far Shidqul; Bachtiar, Fitra A.; Fatyanosa, Tirana Noor
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer Vol 9 No 13 (2025): Publikasi Khusus Tahun 2025
Publisher : Fakultas Ilmu Komputer (FILKOM), Universitas Brawijaya

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Naskah ini akan diterbitkan di SIET
Klasifikasi Berita Palsu Politik berbasis DistilBERT dengan Peningkatan Data Melalui Teknik Augmentasi Teks Sagala, Revaldo Gemino Kantana; Fatyanosa, Tirana Noor; Adikara, Putra Pandu
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer Vol 9 No 9 (2025): September 2025
Publisher : Fakultas Ilmu Komputer (FILKOM), Universitas Brawijaya

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Penyebaran berita palsu politik menjadi salah satu tantangan utama di era digital. Berita semacam ini umumnya disusun secara sengaja untuk menyesatkan dan memengaruhi opini publik, serta sangat mudah tersebar melalui media sosial. Penyebaran berita palsu politik menjadi tantangan signifikan yang memengaruhi opini publik dan integritas demokrasi. Penelitian ini bertujuan untuk mengevaluasi efektivitas dan efisiensi DistilBERT, membandingkannya dengan BERT dan RoBERTa, serta menganalisis dampak augmentasi teks sebagai strategi penyeimbangan kelas data. Metodologi penelitian meliputi pengumpulan data sekunder dari dataset LIAR-PLUS, prapemrosesan teks, dan penerapan teknik augmentasi seperti synonym replacement, random insertion, dan back translation. Model DistilBERT dilatih dalam dua skenario: tanpa dan dengan augmentasi teks, serta dilakukan hyperparameter optimization menggunakan Optuna. Performa model dievaluasi dengan metrik klasifikasi standar. Hasil menunjukkan bahwa RoBERTa, setelah optimasi, adalah model paling efektif dengan f1-score 0,7761 dan waktu inferensi 3,98 detik, unggul dalam mendeteksi kelas minoritas. DistilBERT menjadi model paling efisien dengan f1-score 0,6971 dengan waktu inferensi 2,29 detik, sementara BERT juga mengalami peningkatan menjadi f1-score 0,7349 dengan waktu inferensi 3,83 detik. Dari teknik augmentasi, back translation paling efektif dalam meningkatkan deteksi berita palsu (f1-score 0,6810), meskipun sedikit di bawah DistilBERT tanpa augmentasi. Penelitian ini berkontribusi pada pengembangan sistem klasifikasi berita palsu politik yang lebih efektif.
Fine-Tuning Deep Convolutional Generative Adversarial Networks (DCGAN) untuk Generasi Data Sintetis Citra Fundus Retina Azhari, Muhammad Rizqi; Fatyanosa, Tirana Noor; Dewi, Candra
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer Vol 9 No 10 (2025): Oktober 2025
Publisher : Fakultas Ilmu Komputer (FILKOM), Universitas Brawijaya

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Penelitian ini bertujuan untuk mengembangkan dan menganalisis penerapan Deep Convolutional Generative Adversarial Networks (DCGAN) dalam menghasilkan citra sintetis fundus retina untuk mendukung klasifikasi penyakit mata yang meliputi tiga kelas: normal, katarak, dan glaukoma. Fokus utama penelitian ini adalah menyelidiki pengaruh penyetelan hyperparameter terhadap performa DCGAN, serta membandingkan performa antara pelatihan model menggunakan seluruh dataset dengan pelatihan berdasarkan kelas (class-specific). Metodologi yang digunakan mencakup preprocessing data, perancangan arsitektur DCGAN, hyperparameter tuning menggunakan Optuna, serta pelatihan model menggunakan dua pendekatan: seluruh dataset dan class-specific. Evaluasi model dilakukan dengan dua metrik umum pada GAN, yaitu Frechet Inception Distance (FID) dan Inception Score (IS). Hasil penelitian menunjukkan bahwa konfigurasi hyperparameter terbaik diperoleh dari kombinasi: batch size 64, learning rate generator 0,0079 (Adam, β1=0,4748, β2=0,7258), dan learning rate discriminator 0,0016 (SGD, β1=0,4192, β2=0,6781). Pada pelatihan seluruh dataset, model DCGAN mencapai skor FID terbaik sebesar 113,1952 dan IS sebesar 1,0182. Sementara itu, pada pelatihan class-specific, performa terbaik diperoleh pada kelas normal (FID 89,5971 dan IS 1,0185) dan performa terendah pada kelas katarak (FID 156,0789 dan IS 1,0126). Hasil ini menunjukkan bahwa pelatihan class-specific memungkinkan model mempelajari karakteristik kelas lebih mendalam, sementara pelatihan seluruh dataset menghasilkan generalisasi yang baik terhadap distribusi citra retina secara keseluruhan.
Pengembangan Alat Bantu Investigasi Serangan Siber Berdasarkan Log Server Web Menggunakan Algoritma K-Means Saladin, Abid Faiz; Data, Mahendra; Fatyanosa, Tirana Noor
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer Vol 9 No 12 (2025): Desember 2025
Publisher : Fakultas Ilmu Komputer (FILKOM), Universitas Brawijaya

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Perkembangan infrastruktur teknologi dan jaringan telah menjadikan server web sebagai komponen vital sekaligus target utama berbagai serangan siber, seperti brute-force, denial of service (DoS), dan upaya injection berbahaya. Volume data log yang dihasilkan oleh lalu lintas jaringan pada server beralalu lintas tinggi sangat besar, sehingga analisis keamanan jaringan secara manual menjadi tidak praktis dan rentan human error. Penelitian ini berfokus pada pengembangan sistem yang berfungsi sebagai alat bantu investigasi keamanan jaringan berdasarkan data log server web yang masif. Pendekatan yang digunakan adalah teknik unsupervised learning, yaitu Algoritma K-Means, untuk melakukan pengelompokan data log secara otomatis. Dalam konteks keamanan jaringan, clustering ini bertujuan mengidentifikasi dan memisahkan pola aktivitas normal dari anomali lalu lintas yang mengindikasikan serangan. Proses ini melibatkan prapengolahan log jaringan, termasuk representasi konteks request URL dan fitur-fitur waktu akses. Hasil pengelompokan kemudian disajikan melalui sebuah dasboard visualisasi, yang membantu investigator keamanan siber dalam memprioritaskan pemeriksaan forensik digital pada kelompok data yang paling mencurigakan. Sistem ini menyediakan metodologi yang andal untuk analisis big data log jaringan dalam upaya meningkatkan respons dan investigasi insiden siber.
Klasifikasi Sentimen Lintas Domain pada Komentar Media Sosial Menggunakan IndoBERT dengan Fine-Tuning dan Data Augmentation Marchelo, Nalendra; Fatyanosa, Tirana Noor; Perdana, Rizal Setya
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer Vol 9 No 12 (2025): Desember 2025
Publisher : Fakultas Ilmu Komputer (FILKOM), Universitas Brawijaya

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Analisis sentimen pada komentar media sosial di Indonesia menghadapi tantangan signifikan akibat kompleksitas bahasa yang tidak baku dan ketidakseimbangan distribusi kelas sentimen. Model bahasa pre-trained seperti IndoBERT, yang dilatih pada korpus formal, sering kali mengalami penurunan performa (domain mismatch) ketika diterapkan langsung pada domain ini. Penelitian ini bertujuan untuk mengoptimalisasi kinerja IndoBERT melalui strategi fine-tuning pada dataset sekunder multi-domain serta menerapkan teknik augmentasi data teks, yaitu synonym replacement dan back-translation, guna mengatasi ketidakseimbangan kelas. Evaluasi dilakukan pada dataset uji held-out domain gabungan yang terdiri dari 900 data dengan tiga kelas sentimen. Hasil eksperimen menunjukkan bahwa fine-tuning mutlak diperlukan, di mana model baseline gagal mengenali sentimen dengan weighted f1-score hanya 0,3523. Penerapan fine-tuning meningkatkan kinerja secara signifikan menjadi 0,5994. Lebih lanjut, penggunaan teknik augmentasi synonym replacement terbukti menjadi strategi paling optimal dengan mencatatkan akurasi tertinggi sebesar 69,67% dan weighted f1-score 0,6714. Meskipun teknik back-translation memberikan keseimbangan deteksi kelas yang lebih baik (macro f1 0,5612), teknik ini menunjukkan gejala overfitting selama pelatihan. Penelitian menyimpulkan bahwa kombinasi fine-tuning dan augmentasi synonym replacement adalah metode yang paling efektif dan stabil untuk menangani klasifikasi sentimen lintas domain pada data yang tidak seimbang.
Penerapan Synthetic Context Generation Menggunakan Large Language Model pada Sistem Question Answering Berbasis Retrieval-Augmented Generation untuk Domain Kesehatan Gizi Tanaya, I Putu Paramaananda; Fatyanosa, Tirana Noor; Putra, Hanif Fermanda
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer Vol 10 No 01 (2026): Januari 2026
Publisher : Fakultas Ilmu Komputer (FILKOM), Universitas Brawijaya

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Penerapan Natural Language Processing dan Large Language Model semakin relevan dalam bidang kesehatan, khususnya pada domain gizi anak, seiring dengan kompleksitas penanganan malnutrisi dan keterbatasan proses asesmen gizi yang masih banyak dilakukan secara manual. Penelitian ini mengusulkan pemanfaatan Synthetic Context Generation untuk membangun basis pengetahuan domain-spesifik yang diintegrasikan ke dalam arsitektur Retrieval-Augmented Generation. Konteks sintetis dibentuk dari pasangan pertanyaan dan jawaban menggunakan strategi prompting zero-shot dan few-shot, kemudian diindeks sebagai sumber retrieval. Kualitas konteks dievaluasi menggunakan metrik BLEU, ROUGE, dan BERTScore, sedangkan performa sistem Question Answering dievaluasi menggunakan kerangka RAGAS. Hasil evaluasi menunjukkan bahwa konteks sintetis memiliki kesamaan semantik yang tinggi dengan data referensi, tercermin dari nilai BERTScore-F1 yang berada di atas 0,8300 pada seluruh skenario, meskipun nilai BLEU dan ROUGE bervariasi akibat perbedaan redaksi dan parafrase. Evaluasi sistem RAG menunjukkan nilai context recall yang tinggi, yaitu berada di atas 0,8700 dan mencapai hingga 0,9600, yang mengindikasikan kemampuan retrieval dalam menyediakan konteks yang relevan secara konsisten. Namun, variasi nilai faithfulness dan answer correctness menunjukkan bahwa kualitas jawaban akhir dipengaruhi oleh pengaturan instruksi pada tahap generasi, di mana restriksi instruksi yang lebih ketat meningkatkan keterikatan jawaban terhadap konteks dan menekan risiko halusinasi, sehingga sistem lebih aman digunakan pada domain kesehatan gizi.
Analisis Perbandingan Metode Chunking dalam Chatbot Berbasis Retrieval-Augmented Generation Rekomendasi Terapi Nutrisi Medis Pasien Eman, Eleazar Tadeo; Fatyanosa, Tirana Noor; Aji, Alham Fikri
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer Vol 10 No 01 (2026): Januari 2026
Publisher : Fakultas Ilmu Komputer (FILKOM), Universitas Brawijaya

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Chatbot berbasis kecerdasan buatan semakin banyak digunakan dalam layanan kesehatan, namun akurasi respons sering bergantung pada kualitas proses retrieval dalam sistem Retrieval-Augmented Generation (RAG). Penelitian ini membandingkan tiga metode chunking yaitu recursive chunking, semantic chunking, dan Double Pass Merging Chunking pada chatbot RAG untuk rekomendasi terapi nutrisi medis pasien. Pengujian dilakukan menggunakan dataset laporan nutrisi medis dan dievaluasi dengan BLEU, ROUGE, serta metrik RAGAS seperti context precision, context recall, faithfulness, dan answer relevancy. Hasil analisis menunjukkan bahwa Double Pass Merging Chunking memberikan performa terbaik pada 7 dari 8 metrik evaluasi dengan nilai Context Precision (0,5514), Context Recall (0,2721), Faithfulness (0,2381), BLEU (0,9129), ROUGE-1 (0,1117), ROUGE-2 (0,0174), dan ROUGE-L (0,0680). Semantic chunking menunjukkan peningkatan signifikan pada Context Recall (0,2702) dengan selisih 48% dibandingkan recursive chunking. Temuan ini menegaskan bahwa pemilihan metode chunking berpengaruh signifikan terhadap kualitas rekomendasi nutrisi medis yang dihasilkan chatbot berbasis RAG.
Deteksi Intrusi Berbasis Log Data Menggunakan BERT Model Amadeo, Yoel; Fatyanosa, Tirana Noor; Data, Mahendra
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer Vol 10 No 01 (2026): Januari 2026
Publisher : Fakultas Ilmu Komputer (FILKOM), Universitas Brawijaya

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Keamanan sistem informasi merupakan aspek krusial dalam menjaga kerahasiaan, integritas, dan ketersediaan data pada layanan berbasis web. Penelitian ini menganalisis efektivitas model Bidirectional Encoder Representations from Transformers (BERT) dalam mendeteksi intrusi berbasis log data web server. Dataset yang digunakan berupa web server access logs berlabel dari Kaggle dengan 9.279.228 entri normal dan 2.956 entri attack. Eksperimen dilakukan dengan dua pendekatan: (1) baseline pipeline menggunakan embedding BERT dan reduksi dimensi Manual Incremental PCA sebelum klasifikasi dengan Logistic Regression dan Linear Support Vector Classification, serta (2) fine-tuning pipeline yang melatih ulang model BERT. Untuk mengatasi ketidakseimbangan data, diterapkan Custom SMOTE pada baseline dan upsampling teks pada fine-tuning. Hasil menunjukkan model BERT yang di-fine-tune memberikan F1-score macro average 0,9995 pada rasio 1:10, lebih baik dibanding baseline (0,9976). Penerapan SMOTE dan upsampling terbukti meningkatkan sensitivitas terhadap kelas minoritas. Penelitian ini menyimpulkan bahwa pendekatan berbasis BERT efektif dalam memahami konteks semantik log web dan meningkatkan akurasi deteksi intrusi pada data tidak seimbang.
Penyelarasan Large Language Model terhadap Respon Tidak Etis menggunakan Reinforcement Learning from Human Feedback (RLHF) Hilmi, Fadhilah; Fatyanosa, Tirana Noor; Siagian, Al Hafiz Akbar Maulana
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer Vol 10 No 2 (2026): Februari 2026
Publisher : Fakultas Ilmu Komputer (FILKOM), Universitas Brawijaya

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

LLM atau Large Language Model telah menunjukkan kemampuan luar biasa dalam berbagai tugas pemrosesan bahasa alami, namun masih menghadapi tantangan terkait aspek etika dan keamanan output yang dihasilkan. Supervised Fine-Tuning yang umum digunakan untuk mengatasi masalah ini memiliki keterbatasan dalam hal fleksibilitas dan kemampuan generalisasi terhadap konteks baru. Oleh karena itu penelitian ini bertujuan mengimplementasikan metode Reinforcement Learning from Human Feedback untuk meningkatkan keselarasan model bahasa besar berbahasa Indonesia dengan preferensi dan nilai-nilai manusia. Implementasi RLHF dilakukan melalui tiga tahap: Supervised Fine-Tuning (SFT), pelatihan Reward Model, dan optimasi kebijakan menggunakan Proximal Policy Optimization (PPO). Hasil evaluasi menunjukkan bahwa Reward Model mencapai Pairwise Accuracy 0,80 dan Kendall’s Tau 0,60 dengan kemampuan generalisasi yang baik tanpa mengalami overfitting. Model hasil pelatihan PPO mencapai nilai Harmlessness 0,75 dengan Refusal Rate 0%, mengindikasikan bahwa model tidak lagi memberikan penolakan eksplisit seperti pada penelitian sebelumnya. Respon penolakan tersebut diganti dengan respons yang informatif, kontekstual, dan mengarahkan pengguna pada alternatif yang etis dan aman. Visualisasi SHAP mengonfirmasi perubahan karakteristik respons dari penolakan eksplisit dengan token seperti "tidak dapat menjawab" menjadi arahan informatif dengan token seperti "alternatif" dan "platform legal". Perbandingan dengan model baseline menunjukkan bahwa model hasil RLHF mampu menghasilkan respons dengan nilai Reward yang lebih tinggi pada sebagian besar skenario evaluasi. Meskipun demikian, model masih menunjukkan kelemahan dalam beberapa kasus, khususnya dalam menolak permintaan terkait informasi pribadi yang sensitif. Secara keseluruhan, implementasi RLHF berhasil meningkatkan keselarasan model dengan nilai-nilai keamanan dan kebermanfaatan tanpa mengorbankan kualitas interaksi yang konstruktif.
Analisis Sentimen Layanan PT Kereta Api Indonesia pada Twitter Menggunakan Fine-Tuned IndoBERTweet Zaki, Ahmad; Muflikhah, Lailil; Fatyanosa, Tirana Noor
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer Vol 10 No 2 (2026): Februari 2026
Publisher : Fakultas Ilmu Komputer (FILKOM), Universitas Brawijaya

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Perkembangan layanan digital pada sektor transportasi publik mendorong meningkatnya interaksi pengguna melalui media sosial, khususnya Twitter. Umpan balik pengguna dalam bentuk opini dan keluhan menjadi sumber informasi penting untuk mengevaluasi kualitas layanan, namun volume data yang besar dan bersifat tidak terstruktur menyulitkan analisis secara manual. Oleh karena itu, penelitian ini bertujuan untuk menganalisis sentimen pengguna terhadap layanan PT Kereta Api Indonesia berdasarkan tweet berbahasa Indonesia menggunakan model fine-tuned IndoBERTweet. Penelitian ini menggunakan pendekatan studi kasus dengan data tweet berbahasa Indonesia yang dikumpulkan melalui proses crawling dan dilabeli ke dalam tiga kelas sentimen, yaitu positif, netral, dan negatif. Model IndoBERTweet dilatih dan dievaluasi pada beberapa skenario preprocessing, meliputi baseline tanpa stopword removal dan stemming, penerapan stopword removal, stemming, serta kombinasi keduanya. Selain itu, dilakukan analisis terhadap pengaruh ketidakseimbangan distribusi data melalui penerapan beberapa teknik penanganan data tidak seimbang, yaitu random oversampling, class weighting, text augmentation, dan random undersampling, yang diterapkan pada skenario dengan performa terbaik. Evaluasi kinerja model dilakukan menggunakan metrik accuracy, precision, recall, macro F1-score, dan confusion matrix. Hasil eksperimen menunjukkan bahwa skenario baseline tanpa stopword removal dan stemming memberikan performa terbaik dengan nilai macro F1-score sebesar 0.7702 dan akurasi 0.8333. Penerapan preprocessing tambahan tidak memberikan peningkatan kinerja yang signifikan dan cenderung menurunkan performa, khususnya pada kelas minoritas. Teknik penanganan data tidak seimbang mampu meningkatkan sensitivitas terhadap kelas positif, namun belum melampaui performa baseline secara keseluruhan. Temuan ini menunjukkan bahwa pendekatan preprocessing minimal dengan perhatian terhadap distribusi data lebih sesuai untuk analisis sentimen berbasis IndoBERTweet pada data Twitter.