Claim Missing Document
Check
Articles

Found 13 Documents
Search

Penerapan Arsitektur BERT2BERT pada Model Respon Dialog Chatbot Berbahasa Indonesia dengan Dataset Berukuran Terbatas Lina, Femi Novia; Perdana, Rizal Setya; Fatyanosa, Tirana Noor
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer Vol 8 No 2 (2024): Februari 2024
Publisher : Fakultas Ilmu Komputer (FILKOM), Universitas Brawijaya

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Efisiensi yang ditawarkan menjadikan chatbot sebagai salah satu solusi yang populer untuk beragam permasalahan. Misalnya, dalam konteks layanan akademik, chatbot dapat berperan menghemat sumber daya yang diperlukan dalam menyediakan jawaban pertanyaan yang bersifat rutin, tetapi masih sulit diterapkan karena kurangnya data. Arsitektur yang populer dalam tugas text generation diantaranya encoder-decoder dan decoder-only. Menggunakan arsitektur encoder-decoder, BERT2BERT memanfaatkan BERT pre-trained model yang digunakan untuk inisialisasi komponen encoder dan decoder (Rothe et al., 2020). Arsitektur ini telah digunakan dalam penelitian untuk membangun conversational model berbahasa Arab dan merupakan solusi yang baik untuk permasalahan kurangnya dataset (Naous et al., 2021). Penelitian ini mencoba menggunakan arsitektur BERT2BERT untuk membangun model respon chatbot berbahasa Indonesia dengan data terbatas dan untuk keperluan layanan akademik. Hasil dari penelitian ini adalah arsitektur BERT2BERT memberikan performa yang kurang dengan perplexity score yang diperoleh adalah 573.0654, sementara perplexity score dari model GPT2 adalah 61.2645. Skor cosine similarity juga lebih rendah di angka 0.4009 dibandingkan dengan model GPT2 dengan skor cosine similarity 0.7037. Meskipun begitu, model BERT2BERT memberikan hasil yang lebih baik dibandingkan dengan model encoder-decoder sejenis, BERT2GPT. Model dengan arsitektur encoder-decoder seperti BERT2BERT tidak unggul dalam penelitian ini kemungkinan dikarenakan sulitnya mendapatkan konteks dari data yang berukuran terbatas.
Analisis Sentimen Masyarakat terhadap Kereta Cepat Whoosh pada Platform X menggunakan IndoBERT Hakim, Gibran; Fatyanosa, Tirana Noor; Widodo, Agus Wahyu
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer Vol 8 No 10 (2024): Oktober 2024
Publisher : Fakultas Ilmu Komputer (FILKOM), Universitas Brawijaya

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Infrastruktur kereta api cepat di Indonesia relatif tertinggal dibandingkan negara lain. Perkembangannya baru dimulai dengan proyek kereta cepat Jakarta-Bandung (Whoosh) yang baru dimulai pada 2015 dan selesai pada 2023. Proyek kerja sama Indonesia-China ini sangat menarik perhatian publik, terutama di media sosial seperti X. Penelitian ini bertujuan mengklasifikasikan sentimen publik sebagai positif, negatif, atau netral menggunakan pemrosesan bahasa alami (NLP). IndoBERT sebagai model NLP yang dilatih khusus untuk bahasa Indonesia, digunakan untuk menganalisis sentimen secara efektif. Penelitian ini melakukan pengujian pada dataset Whoosh hasil scraping pada platform X dengan konfigurasi hyperparameter seperti jumlah epoch, learning rate, dan batch size. Performa terbaik dicapai dengan konfigurasi 3 epoch, learning rate 2e-5, dan batch size 32 yang menghasilkan metrik evaluasi accuracy, recall, precision, dan f1-score sebesar 0,78. Hasil ini menunjukkan learning rate yang lebih kecil memberikan pembelajaran yang stabil, sementara batch size yang lebih besar memberikan estimasi gradien yang konsisten. Namun, model kesulitan mengklasifikasikan sentimen netral sehingga sering salah mengklasifikasikannya sebagai positif atau negatif. Hasil ini juga menunjukkan adanya overfitting, di mana model tampil baik pada data pelatihan tetapi menurun pada data pengujian yang menunjukkan fokus berlebihan pada detail dan noise dari data pelatihan. Penelitian ini menyoroti pentingnya pemilihan model dan konfigurasi hyperparameter dalam analisis sentimen.
Analisis Sentimen Terhadap Program Indonesian International Student Mobility Award (IISMA) di Platform X / Twitter Menggunakan TF-IDF dan SVM Fidian, Diagne Alya; Fatyanosa, Tirana Noor; Ridok, Achmad
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer Vol 9 No 1 (2025): Januari 2025
Publisher : Fakultas Ilmu Komputer (FILKOM), Universitas Brawijaya

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Indonesian International Student Mobility Award (IISMA) adalah program Merdeka Belajar Kampus Merdeka (MBKM) yang bertujuan memperluas wawasan dan membangun hubungan internasional bagi mahasiswa Indonesia. Penelitian ini menganalisis sentimen masyarakat terhadap IISMA di platform X menggunakan metode analisis sentimen berbasis Support Vector Machine (SVM) dengan kernel linear, polinomial, dan Radial Basis Function (RBF). Dataset diperoleh melalui web scraping dan diolah menggunakan text mining dengan ekstraksi fitur TF-IDF. Hasil menunjukkan bahwa model SVM mampu mengklasifikasikan sentimen ke dalam tiga kelas yaitu positif, netral, dan negatif, namun kesulitan dalam memprediksi kelas negatif akibat ketidakseimbangan dataset. Kernel RBF memiliki kinerja terbaik dengan precision 70,52% dan akurasi 62,92%, sedangkan kernel linear menghasilkan F1-score tertinggi sebesar 53%, menunjukkan keseimbangan antara precision dan recall. Pengujian kinerja model pada teks berbahasa Indonesia dan Inggris menunjukkan bahwa teks berbahasa Inggris memberikan hasil lebih baik dengan akurasi 71,11% dibandingkan 62,44% pada teks berbahasa Indonesia yang didukung oleh kemampuan TextBlob dalam mengenali pola sentimen bahasa Inggris secara lebih akurat. Hasil ini menggarisbawahi pentingnya strategi khusus untuk meningkatkan kinerja analisis sentimen pada teks berbahasa Indonesia, termasuk pelabelan manual atau penggunaan alat analisis sentimen yang mendukung bahasa tersebut.
Analisis Sentimen Terhadap Makanan Manis Di Platform X Menggunakan TF-IDF dan Naive Bayes Murnastiti, Nurul Annisa; Fatyanosa, Tirana Noor; Marji
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer Vol 9 No 1 (2025): Januari 2025
Publisher : Fakultas Ilmu Komputer (FILKOM), Universitas Brawijaya

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Perkembangan media sosial telah mempermudah masyarakat dalam berbagi pendapat mengenai berbagai topik, termasuk makanan manis. Analisis sentimen terhadap pendapat tersebut memberikan wawasan berharga bagi industri makanan untuk memahami persepsi konsumen, mengidentifikasi preferensi, dan merancang strategi pemasaran. Penelitian ini bertujuan untuk menganalisis sentimen pada ulasan makanan manis menggunakan algoritma Naive Bayes. Data yang digunakan dikumpulkan dari platform X, meliputi ulasan berbahasa Indonesia. Proses analisis meliputi pembersihan data, tokenisasi, penghapusan stopwords, stemming, dan ekstraksi fitur menggunakan TF-IDF. Sentimen dibagi menjadi tiga kategori: positif, negatif, dan netral. Hasil penelitian menunjukkan bahwa algoritma Naive Bayes mencapai akurasi sebesar 67,1%, dengan kontribusi signifikan pada pengelompokan sentimen positif sebagai kategori dominan. Temuan ini memberikan wawasan penting bagi produsen makanan dalam memahami persepsi konsumen terhadap makanan manis serta menjadi referensi bagi penelitian di bidang analisis sentimen dan pemasaran digital.
Hybrid Genetic Algorithm and Simulated Annealing for Function Optimization Fatyanosa, Tirana Noor; Sihananto, Andreas Nugroho; Alfarisy, Gusti Ahmad Fanshuri; Burhan, M Shochibul; Mahmudy, Wayan Firdaus
Journal of Information Technology and Computer Science Vol. 1 No. 2: November 2016
Publisher : Faculty of Computer Science (FILKOM) Brawijaya University

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (879.719 KB) | DOI: 10.25126/jitecs.20161215

Abstract

The optimization problems on real-world usually have non-linear characteristics. Solving non-linear problems is time-consuming, thus heuristic approaches usually are being used to speed up the solution’s searching. Among of the heuristic-based algorithms, Genetic Algorithm (GA) and Simulated Annealing (SA) are two among most popular. The GA is powerful to get a nearly optimal solution on the broad searching area while SA is useful to looking for a solution in the narrow searching area. This study is comparing performance between GA, SA, and three types of Hybrid GA-SA to solve some non-linear optimization cases. The study shows that Hybrid GA-SA can enhance GA and SA to provide a better result
Analisis Sentimen Pengguna Indodax Menggunakan FastText dan Convolutional Neural Network (CNN) Maulana, Muhammad Taufik; Muflikhah, Lailil; Fatyanosa, Tirana Noor
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer Vol 9 No 6 (2025): Juni 2025
Publisher : Fakultas Ilmu Komputer (FILKOM), Universitas Brawijaya

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Perkembangan pesat investor cryptocurrency di Indonesia, yang jumlahnya melampaui investor pasar saham, menyoroti pentingnya platform perdagangan seperti Indodax. Ulasan pengguna menjadi krusial untuk evaluasi layanan, namun volumenya yang besar memerlukan analisis otomatis. Penelitian ini bertujuan untuk membangun dan mengevaluasi model deep learning untuk analisis sentimen pada ulasan aplikasi Indodax dari Google Play Store. Metode yang digunakan adalah kombinasi FastText sebagai word embedding dan convolutional neural network (CNN) untuk klasifikasi sentimen ke dalam tiga kelas yaitu positif, negatif, dan netral. Pengujian difokuskan pada tiga aspek utama yaitu pengaruh ukuran kernel CNN (3, 4, dan 5), dampak tahapan preprocessing data, dan kinerja keseluruhan model. Hasil penelitian menunjukkan bahwa model dengan ukuran kernel 5 mencapai akurasi tertinggi sebesar 0,8079. Tahapan preprocessing data, terutama cleaning, terbukti krusial dalam meningkatkan kinerja model. Secara keseluruhan, model kombinasi FastText dan CNN menunjukkan kinerja yang solid, meskipun menghadapi tantangan dalam membedakan ulasan netral dan negatif. Penelitian ini memberikan kontribusi dalam penerapan analisis sentimen di domain keuangan digital Indonesia. 
Analisis Sentimen Publik Terhadap Layanan Transjakarta dalam Program Jaklingko Pada Platform X Menggunakan Embedding Word2vec dan Convolutional Neural Network Al Kautsar, Prima Daffa; Muflikhah, Lailil; Fatyanosa, Tirana Noor
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer Vol 9 No 7 (2025): Juli 2025
Publisher : Fakultas Ilmu Komputer (FILKOM), Universitas Brawijaya

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Seiring meningkatnya penggunaan media sosial, masyarakat semakin aktif menyuarakan opini terhadap layanan publik, termasuk TransJakarta. Platform X (sebelumnya Twitter) menjadi wadah utama pengguna untuk menyampaikan apresiasi maupun keluhan terhadap layanan transportasi tersebut. Kondisi ini mendorong perlunya analisis sentimen otomatis guna memahami persepsi publik secara luas dan efisien. Penelitian ini bertujuan mengklasifikasikan sentimen komentar pengguna terhadap layanan TransJakarta dalam program JakLingko dengan memanfaatkan kombinasi metode Word2Vec dan Convolutional Neural Network (CNN). Komentar dikumpulkan melalui crawling dan diproses melalui tahapan pre-processing seperti pembersihan teks, tokenisasi, dan stemming. Representasi teks dilakukan menggunakan dua pendekatan Word2Vec, yaitu Continuous Bag-of-Words (CBOW) dan Skip-gram, dengan parameter vector size 100, window size 5, min count 3, dan 10 epoch. Model CNN dibangun dengan kernel size 3, 16 filter, dropout rate 0,5, batch size 32, serta optimizer Adam. Pengujian dengan 5-Fold Cross Validation menunjukkan pendekatan Skip-gram menghasilkan kinerja lebih baik dibandingkan CBOW, dengan F1-Score tertinggi 0,7163 dan MCC 0,5900. Pada pengujian akhir, model CNN dengan embedding Skip-gram dan konfigurasi learning rate 0,0005 serta 15 epoch memperoleh F1-Score 0,7167, MCC 0,5898, dan akurasi 0,7276.
Klasifikasi Emosi Multikelas Berbasis Teks Bahasa Indonesia Menggunakan IndoRoBERTa Lazuardi, Muhammad Dzakwan Bintang; Fatyanosa, Tirana Noor; Marji
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer Vol 9 No 9 (2025): September 2025
Publisher : Fakultas Ilmu Komputer (FILKOM), Universitas Brawijaya

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Revolusi digital telah mengubah pola komunikasi manusia secara signifikan. Pada 2025, diperkirakan 5,56 miliar orang akan menggunakan internet, dengan lebih dari 76,9% populasi dunia aktif di media sosial. Media sosial kini menjadi platform utama untuk ekspresi emosi dan opini, terutama di WhatsApp, Instagram, TikTok, dan X (Twitter). Namun, tantangan yang dihadapi adalah keragaman ekspresi emosi yang diekspresikan dalam teks menggunakan berbagai bahasa. Penelitian ini memanfaatkan IndoRoBERTa, model transformer yang diadaptasi untuk Bahasa Indonesia, untuk klasifikasi emosi multikelas pada teks berbahasa Indonesia, dengan kategori emosi seperti anger, fear, joy, love, sad, dan neutral. Data yang digunakan berasal dari gabungan dua dataset publik, yang telah diproses melalui tahapan preprocessing, balancing kelas, dan pembagian data secara stratified untuk menjaga proporsi label emosi. Model IndoRoBERTa dioptimalkan menggunakan fine-tuning dan Optuna untuk pencarian konfigurasi hyperparameter optimal, termasuk batch size, learning rate, dan dropout. Evaluasi model menggunakan metrik accuracy, precision, recall, F1-score, dan confusion matrix, yang menunjukkan macro F1-score sebesar 0,70 pada data uji. Model ini berhasil mengklasifikasikan emosi mayoritas dengan baik, meskipun menghadapi tantangan dalam membedakan kelas neutral dan sad. Penelitian ini memberikan kontribusi dalam pengembangan sistem klasifikasi emosi berbasis teks untuk Bahasa Indonesia, dengan potensi penerapan pada analisis opini publik, monitoring media sosial, dan pengembangan chatbot.
Analisis Sentimen Masyarakat Terhadap Fenomena Perubahan Iklim Menggunakan BERT-CNN Ravindra Rahman, Azka; Fatyanosa, Tirana Noor; Adikara, Putra Pandu
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer Vol 9 No 9 (2025): September 2025
Publisher : Fakultas Ilmu Komputer (FILKOM), Universitas Brawijaya

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Perubahan iklim merupakan salah satu isu global yang paling banyak dibicarakan di media sosial, seperti X. Meskipun konsensus ilmiah menyatakan bahwa perubahan iklim disebabkan oleh aktivitas manusia, opini publik masih terbagi, dan perbedaan tersebut tidak hanya memengaruhi opini individu, tetapi juga dapat berdampak pada pengambilan kebijakan lingkungan. Untuk memahami opini publik, berbagai model NLP dikembangkan, namun tantangan pada penggunaan model NLP tradisional adalah keterbatasannya dalam menangkap informasi kontekstual dalam sebuah kalimat. Oleh karena itu, model hibrida BERT-CNN diusulkan dengan anggapan bahwa embedding kontekstual pada BERT beserta kemampuan ekstraksi fitur CNN mampu mengklasifikasikan sentimen publik terhadap isu perubahan iklim. Metode yang digunakan dimulai dengan persiapan data, perancangan model, pelatihan model, pengujian model, dan perbandingan model utama dengan model lainnya. Hasil eksperimen menunjukkan bahwa model BERT-CNN cukup baik dalam mengklasifikasikan sentimen publik terkait perubahan iklim, dibuktikan dengan nilai f1-score-nya yang sebesar 0,7197. Model juga menunjukkan kinerja pada kelas minoritas yang lebih baik dibandingkan pada model BERT atau CNN secara terpisah. Dengan demikian, penelitian ini memberi wawasan baru terhadap pengembangan metode analisis sentimen berbasis deep learning pada isu perubahan iklim.
Analisis Perbandingan Model Machine Learning Tree-Based dan Non-Tree-Based untuk Tugas Klasifikasi Hilmi, Fadhilah; Taqiyassar, Kenzie; Pratama, Naufal Romero Putra; Kusuma, Satrio Condro; Nurwachid, Hafiz Rizky; Fatyanosa, Tirana Noor
Jurnal Teknologi Informasi dan Ilmu Komputer Vol 12 No 4: Agustus 2025
Publisher : Fakultas Ilmu Komputer, Universitas Brawijaya

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.25126/jtiik.124

Abstract

Penelitian ini membahas perbandingan performa model machine learning berbasis pohon keputusan (Tree-Based) dan non-pohon keputusan (Non-Tree-Based) dalam tugas klasifikasi. Model Tree-based yang diuji meliputi LightGBM, CatBoost, XGBoost, dan Random Forest, sedangkan model Non-tree-based meliputi SVM, KNN, dan GaussianNB. Evaluasi dilakukan pada tiga dataset berbeda, yaitu Spaceship Titanic, Horse Health, dan Keep It Dry. Metrik yang digunakan untuk mengevaluasi performa model adalah AUC-ROC, akurasi, dan F1-score Micro. Hasil penelitian menunjukkan bahwa model berbasis pohon keputusan seperti CatBoost dan LightGBM umumnya memberikan performa yang lebih baik dibandingkan dengan model non-pohon keputusan. CatBoost khususnya menunjukkan hasil terbaik dalam hal akurasi, AUC-ROC, dan F1-score Micro di sebagian besar dataset yang diuji. Selain itu, penelitian ini juga menyoroti pentingnya pemilihan model yang tepat berdasarkan karakteristik dataset yang digunakan. Faktor-faktor seperti kompleksitas data, jumlah fitur, dan distribusi kelas sangat mempengaruhi hasil akhir dari setiap model yang diterapkan. Dengan demikian, temuan ini dapat membantu praktisi machine learning dalam memilih model yang paling sesuai untuk tugas klasifikasi tertentu.   Abstract This study discusses the performance comparison of tree-based and non-tree-based machine learning models for classification tasks. The Tree-based models tested include LightGBM, CatBoost, XGBoost, and Random Forest, while the Non-tree-based models include SVM, KNN, and GaussianNB. The evaluation was conducted on three different datasets, namely Spaceship Titanic, Horse Health, and Keep It Dry. The metrics used to evaluate model performance are AUC-ROC, accuracy, and F1-score Micro. The results show that tree-based models such as CatBoost and LightGBM generally provide better performance compared to non-tree-based models. CatBoost, in particular, showed the best results in terms of accuracy, AUC-ROC, and F1-score Micro in most of the datasets tested. Additionally, this study highlights the importance of selecting the appropriate model based on the characteristics of the datasets used. Factors such as data complexity, number of features, and class distribution significantly affect the final results of each applied model. Thus, these findings can assist machine learning practitioners in choosing the most suitable model for specific classification tasks.