Claim Missing Document
Check
Articles

Penerapan Teknologi LangChain pada Question Answering System Fikih Empat Madzhab: Application of Langchain Technology to the Fiqh Question Answering System of Four Madhhab Rahayu, Suci; Harahap, Nazruddin Safaat; Agustian, Surya; Pizaini, Pizaini
MALCOM: Indonesian Journal of Machine Learning and Computer Science Vol. 4 No. 3 (2024): MALCOM July 2024
Publisher : Institut Riset dan Publikasi Indonesia

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.57152/malcom.v4i3.1397

Abstract

Fikih sebagai ilmu yang luas, terkadang menimbulkan beragam persoalan dan perbedaan pandangan antara madzhab-madzhabnya. Tujuan pandangan ulama tentang isu-isu fikih adalah untuk memperkaya opsi pemahaman, bukan menyebabkan perpecahan. Keberadaan mazhab penting bagi umat Islam awam dalam memahami hukum Islam, karena membantu dalam menafsirkan Al-Qur'an dan Hadits untuk masalah sehari-hari. Pengiriman informasi saat ini dapat dilakukan dengan cepat dan mudah, salah satunya melalui aplikasi tanya jawab atau Question Answering System (QAS) terkait materi yang ingin diketahui oleh pengguna. Sehingga pada penelitian ini bertujuan membuat sebuah QAS berbasis web tentang fikih empat madzhab menggunakan teknologi LangChain dan Large Language Model (LLM). LangChain dan model LLM mampu memberikan jawaban atas pertanyaan terkait file Portable Document Format (PDF). QAS dilatih menggunakan kumpulan data berupa file PDF serta memanfaatkan model LLM untuk menghasilkan respons teks yang relevan terhadap pertanyaan yang diajukan oleh pengguna. Sistem yang telah dikembangkan berhasil memberikan respons kepada pengguna dengan pengujian menggunakan BERTScore yang mendapatkan nilai rata-rata dari precision sebesar 80%, recall sebesar 81%, dan f-1 score sebesar 81%. Sedangkan ROUGEScore mendapatkan nilai rata-rata dari ROUGE-1 sebesar 56%, 58%, dan 56%, ROUGE-2 sebesar 33%, 33%, 33%, dan ROUGE-L sebesar 43%, 44%, dan 43%.
Pengelompokan Data Pendistribusian Listrik Menggunakan Algoritma Mini Batch K-Means Clustering: Grouping Electricity Distribution Data Using The Mini Batch K-Means Clustering Algorithm Mulyadi, Syahrul; Insani, Fitri; Agustian, Surya; Afriyanti, Liza
MALCOM: Indonesian Journal of Machine Learning and Computer Science Vol. 4 No. 3 (2024): MALCOM July 2024
Publisher : Institut Riset dan Publikasi Indonesia

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.57152/malcom.v4i3.1425

Abstract

Manajemen distribusi listrik merupakan aspek penting dalam infrastruktur yang memerlukan pemahaman mendalam tentang pola distribusi di berbagai wilayah untuk memastikan pasokan listrik stabil bagi masyarakat dan pemerintah. Namun, mengelola data distribusi listrik yang melibatkan berbagai variabel seperti rumah tangga, industri, bisnis, sosial, gedung kantor pemerintah, dan jalan umum membutuhkan pendekatan yang efektif dalam mengelompokkan data untuk mengidentifikasi pola-pola yang signifikan. Penelitian ini bertujuan mengimplementasikan algoritma mini batch k-means untuk mengelompokkan distribusi listrik di setiap wilayah. Data yang digunakan dalam penelitian ini adalah data distribusi listrik dari tahun 2014-2022 yang terdiri dari 35 provinsi. Hasil pengujian menunjukkan bahwa terdapat tiga cluster yang signifikan dalam data peneliti, masing-masing ditandai dengan Silhouette Score yang berbeda. Cluster dengan Silhouette Score tertinggi adalah Cluster 2 dengan nilai 0.625, menunjukkan kohesi yang tinggi di wilayah regional Kalimantan-Sulawesi yang diamati dalam cluster 2 ini. Sementara itu, Cluster 4 memiliki Silhouette Score yang terendah dengan nilai 0.419, menunjukkan tingkat kohesi yang lebih rendah dalam pola distribusi listrik di setiap wilayah regional bagian Kalimantan-Sulawesi. Penelitian ini menegaskan bahwa algoritma mini batch k-means efektif untuk pengelompokkan data distribusi listrik dengan hasil yang memuaskan dalam pemisahan klaster yang berbeda
Pengelompokan Data Pendistribusian Listrik Menggunakan Algoritma Density Based Spatial Clustering of Application With Noise (DBSCAN): Clustering Electricity Distribution Data Using Density-Based Spatial Clustering of Applications With Noise (DBSCAN) Algorithm Farid, Miftah; Insani, Fitri; Agustian, Surya; Afriyanti, Liza
MALCOM: Indonesian Journal of Machine Learning and Computer Science Vol. 4 No. 3 (2024): MALCOM July 2024
Publisher : Institut Riset dan Publikasi Indonesia

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.57152/malcom.v4i3.1426

Abstract

Pada masa kini, listrik sudah menjadi kebutuhan penting dalam kehidupan, karena kebanyakan aktivitas manusia bergantung pada listrik. Kebutuhan listrik pada setiap wilayah di Indonesia dipengaruhi oleh sejumlah faktor dan karakteristik khusus masing-masing. PLN mempublikasikan statistik penggunaan listrik untuk setiap wilayah di Indonesia dari tahun 2014 hingga 2022, yang terdiri dari 35 provinsi di Indonesia. Data ini menawarkan wawasan berharga untuk prediksi permintaan listrik, pelacakan tren historis untuk memprediksi pengembangan wilayah, memprioritaskan wilayah dengan permintaan tinggi untuk efisiensi dan konservasi energi, dan lain sebagainya.  Salah satu alat untuk mencapai tujuan tersebut adalah dengan mengelompokkan (clustering) wilayah berdasarkan karakteristik dan ciri-ciri wilayahnya. Penelitian ini melakukan proses clustering dengan membagi data pada tiga regional utama: Sumatera, Jawa-Bali, dan Kalimantan-Sulawesi, sementara regional Papua tidak dianalisis karena jumlah wilayah/propinsi yang terbatas. Metode yang dipakai adalah Density-Based Spatial Clustering of Applications with Noise (DBSCAN). Tuning parameter dengan cara pencarian grid dilakukan untuk memperoleh hasil optimal berdasarkan silhouette score. Hasil clustering dapat memberikan gambaran keunikan profil konsumsi listrik di tiap wilayah, dengan silhouette score terbaik sebesar 0.62 untuk regional Jawa-Bali, 0,67 untuk Kalimantan-Sulawesi, dan 0,64 untuk Sumatera. Penelitian menunjukkan bahwa algoritma DBSCAN dapat digunakan untuk pengelompokkan distribusi listrik dengan hasil yang efektif.
Pengelompokan Data Pendistribusian Listrik Menggunakan Algoritma Mean Shift: Clustering Electricity Distribution Data Using the Mean Shift Algorithm Utari, Roid Fitrah; Insani, Fitri; Agustian, Surya; Afriyanti, Liza
MALCOM: Indonesian Journal of Machine Learning and Computer Science Vol. 4 No. 3 (2024): MALCOM July 2024
Publisher : Institut Riset dan Publikasi Indonesia

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.57152/malcom.v4i3.1428

Abstract

Penelitian ini mengkaji regionalisasi dan klasterisasi data distribusi listrik di Indonesia menggunakan algoritma Mean Shift, dengan tujuan untuk meningkatkan efisiensi distribusi energi di berbagai wilayah geografis yang beragam. Listrik memiliki peran krusial dalam kehidupan modern namun distribusinya masih belum merata, terutama di daerah terpencil dan pedesaan yang terkendala oleh akses dan keterbatasan dana. Sebagai salah satu Bada Usaha Milik Negera (BUMN)  utama di sektor ketenagalistrikan, Perusahaan Listrik Negera (PLN) bertanggung jawab dalam menyediakan listrik di seluruh Indonesia, mendukung pertumbuhan ekonomi melalui penyediaan energi untuk sektor industri, pertanian, dan perdagangan. Dengan menggunakan algoritma Mean Shift, penelitian ini mengelompokkan Indonesia menjadi Sumatra, Jawa-Bali, Kalimantan-Sulawesi, dan Papua berdasarkan pola distribusi listrik, dengan menemukan bahwa pengaturan bandwidth optimal 0.5 menghasilkan tiga klaster per wilayah yang mencerminkan infrastruktur serupa, kebutuhan energi, dan sektor ekonomi dominan. Temuan ini menunjukkan fleksibilitas Mean Shift dalam menangani struktur data yang kompleks tanpa jumlah klaster yang telah ditentukan sebelumnya, yang penting untuk perencanaan strategis dalam pengelolaan energi di Indonesia demi mencapai distribusi listrik yang lebih efisien dan berkelanjutan
Peningkatan Performa Klasifikasi Sentimen Tweet Kaesang Menggunakan Naïve Bayes dengan PSO pada Dataset Kecil Muhammad Ravil; Agustian, Surya; Fikry, Muhammad; Insani, Fitri
KLIK: Kajian Ilmiah Informatika dan Komputer Vol. 4 No. 6 (2024): Juni 2024
Publisher : STMIK Budi Darma

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.30865/klik.v4i6.1939

Abstract

After the news of Kaesang's appointment as the Chairman of the Indonesian Solidarity Party (PSI), various speculations emerged on social media, particularly on Twitter (X). This study aims to classify sentiments regarding Kaesang's appointment as PSI Chairman using the Naïve Bayes algorithm optimized with Particle Swarm Optimization (PSO). The data used in this study consists tweets about Kaesang and tweets related to COVID-19. The text preprocessing process includes cleaning, case folding, tokenizing, stemming, and stopword removal. TF-IDF is used to represent words in vector form. In the initial experiment, Naïve Bayes performed classification using Kaesang data combined with COVID-19 data, with 300 data points for each label. Particle Swarm Optimization was used to improve the performance of the Naïve Bayes algorithm. The experiment results showed that the model tested with test data achieved the highest f1-score of 50%.
Klasifikasi Sentimen SVM Dengan Dataset yang Kecil Pada Kasus Kaesang Sebagai Ketua Umum PSI El Saputra, Yoga; Agustian, Surya; Yusra, Yusra; Ramadhani, Siti
KLIK: Kajian Ilmiah Informatika dan Komputer Vol. 4 No. 6 (2024): Juni 2024
Publisher : STMIK Budi Darma

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.30865/klik.v4i6.1944

Abstract

Social media has become the main platform for the public to express views and opinions on various events, including the appointment of Kaesang Pangarep as General Chair of the Indonesian Solidarity Party (PSI). This research aims to classify public sentiment towards the appointment using the Support Vector Machine (SVM) method with the Term Frequency-Inverse Document Frequency (TF-IDF) approach. Data was collected from Twitter using the keyword "Kaesang PSI" as well as external data on topics related to Covid-19. In the kaeasang data, 300 data were taken with each label (positive, neutral, negative) to get 100 tweets and added external data of 900 data with each label (positive, neutral, negative) to get 300 tweets. After the text preprocessing process which includes case folding, stopword removal, and stemming. The model was tested using a confusion matrix to evaluate performance based on accuracy, precision, recall and F1 Score metrics. The results show that the SVM model with TF-IDF has an F1 Score of 0.53, accuracy of 0.62, precision of 0.52, and recall of 0.57. Adding external data related to Covid-19 to the TF-IDF feature has been proven to significantly improve model performance. In conclusion, the SVM method with TF-IDF is effective in analyzing sentiment on social media even with small datasets.
Klasifikasi Sentimen Terhadap Topik Pindah Ibu Kota Negara Pada Twitter Menggunakan Metode Naïve Bayes Classifier Dermawan, Jozu; Yusra, Yusra; Fikry, Muhammad; Agustian, Surya; Oktavia, Lola
Jurnal Sistem Komputer dan Informatika (JSON) Vol 5, No 3 (2024): Maret 2024
Publisher : STMIK Budi Darma

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.30865/json.v5i3.7475

Abstract

Towards the middle of 2019, President Joko Widodo announced plans to relocate Indonesia's capital city. This caused pros and cons in the community, which were widely observed in various social media. To quickly measure the level of public sentiment towards the policy of moving the National Capital City (IKN), whose construction is already underway, a classification system that has good performance is needed. This research proposes a classification of public sentiment on the topic using the Naïve Bayes Classifier method. The data used in this study amounted to 4000 tweets that have been classified into two classes, namely 2000 positive class data and 2000 negative class data. The purpose of this research is how to apply the Naïve Bayes Classifier method in classifying sentiment on the topic of moving the nation's capital and determine the accuracy level of the method. The application of the Naïve Bayes classification method using TF-IDF features to classify 10% of the data as testing data resulted in an accuracy of 77.00%, for a precision value of 77.06%, recall 77.08% and f1-score of 77.00%. Based on the results achieved, the Naïve Bayes Classifier method is good at text classification tasks, with a fairly good accuracy rate.
Penggunaan Model Bahasa indoBERT pada metode Random Forest untuk Klasifikasi Sentimen dengan Dataset Terbatas Pranata, Joni; Agustian, Surya; Jasril, Jasril; Haerani, Elin
Building of Informatics, Technology and Science (BITS) Vol 6 No 3 (2024): December 2024
Publisher : Forum Kerjasama Pendidikan Tinggi

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.47065/bits.v6i3.6335

Abstract

Masalah keterbatasan data latih menjadi tantangan utama dalam klasifikasi sentimen di berbagai bahasa, termasuk bahasa Indonesia, terutama untuk analisis sentimen terkait topik tertentu. Hal ini disebabkan oleh berbagai faktor, dan umumnya adalah kebutuhan untuk mengetahui dengan segera bagaimana sentimen terhadap suatu isu, sehingga tidak mungkin menghabiskan waktu untuk memberi label yang cukup pada data untuk proses pelatihan. Penelitian ini mengusulkan model klasifikasi sentimen dengan sumber data pelatihan yang sedikit, pada studi kasus pengangkatan Kaesang Pangarep sebagai ketua umum PSI. Algoritma Random Forest digunakan sebagai model dasar (baseline) yang dioptimasi dengan penambahan data eksternal untuk training, pemrosesan teks (text preprocessing) dan parameter tuning. Fitur input yang digunakan adalah model bahasa IndoBERT sebagai embedding kata untuk menghasilkan representasi teks yang lebih kontekstual. Hasil penelitian menunjukkan bahwa metode IndoBERT dengan Random Forest yang dioptimasi memberikan peningkatan performa yang signifikan dibandingkan baseline, sebesar 6%. Hasil klasifikasi model yang paling optimal sebesar 54% unutk F1-score dan 63% akurasi. Temuan ini menegaskan bahwa penambahan data eksternal dan optimasi parameter dapat meningkatkan kemampuan generalisasi model dalam klasifikasi sentimen bahasa Indonesia. Penelitian ini diharapkan dapat menjadi referensi metodologis bagi studi klasifikasi sentimen serupa yang menghadapi kendala ukuran dataset.
Klasifikasi Sentimen Menggunakan Metode Passive Aggressive dengan Menggunakan Model Bahasa BERT pada Dataset Kecil Subhi, Yazid Abdullah; Agustian, Surya; Irsyad, Muhammad; Insani, Fitri
Building of Informatics, Technology and Science (BITS) Vol 6 No 3 (2024): December 2024
Publisher : Forum Kerjasama Pendidikan Tinggi

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.47065/bits.v6i3.6389

Abstract

Text classification is one of the most popular tasks in natural language processing, especially in the context of sentiment classification. Insufficient training data poses a significant challenge in many text classification studies. This research focuses on optimizing classification performance using the Passive Aggressive (PA) algorithm, leveraging limited training data. It compares conventional text representation methods like TF-IDF with modern approaches employing word embeddings such as FastText and BERT. The primary dataset encompasses sentiment issues related to Kaesang Pangarep's appointment as the chairman of PSI, gathered through Twitter crawling, and classified into positive, negative, and neutral sentiment labels. Two versions of the training data, each containing only 300 balanced tweets for positive, negative, and neutral classes, were used. The data was split 80% for training and 20% for validation in the search for an optimal model. External data with different issues and pre-existing sentiment labels was used to augment the training data. Experimental results demonstrated that the BERT language model, used as input features for the Passive Aggressive method with hyperparameter tuning, outperformed TF-IDF features. Evaluation on the test data revealed that BERT features with Passive Aggressive achieved an F1-score of 0.52, surpassing the conventional TF-IDF representation with an F1-score of 0.42. The utilization of the BERT language model significantly contributed to improving text classification performance in the field of natural language processing, particularly for the Passive Aggressive method.
Aplikasi Web Question Answering Menggunakan Langchain OpenAI Tentang Peraturan Perundang-undangan Bidang Pendidikan Saputra, Ikhsan Dwi; Harahap, Nazruddin Safaat; Agustian, Surya; Fikry, Muhammad; Oktavia, Lola
Journal of Computer System and Informatics (JoSYC) Vol 6 No 1 (2024): November 2024
Publisher : Forum Kerjasama Pendidikan Tinggi (FKPT)

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.47065/josyc.v6i1.6182

Abstract

In the rapid development of information technology over the past few years, the ease of accessing information has been one of the significant achievements. Artificial intelligence (AI) has emerged as a potential tool in bringing innovative solutions in various sectors of human life. This research aims to develop a web application capable of answering questions related to educational legislation using the LangChain framework and BERT model. The primary issue addressed is the complexity and volume of legal documents that are challenging for lay users to access and understand. The methodology involves converting legal documents from PDF to text, segmenting the text using LangChain, and evaluating system performance with BERTScore and ROUGE Score. The results indicate that BERTScore is superior in measuring the alignment between the system’s answers and reference answers, with some questions achieving a score of 100%. However, there are limitations, such as the manual effort required for document conversion and the substantial computational resources needed for text processing. This research significantly contributes to facilitating access and comprehension of educational legal documents and opens opportunities for further development with more advanced conversion techniques and AI models.
Co-Authors .Safrizal, Safrizal Afdhal Zikri Afriyanti, Liza Aftari, Dhea Putri AGUNG SUCIPTO Ahmad, Rizmah Zakiah Nur Alfitra Salam Arasy, Abdurrahman Ash Shiddicky Aulia Ramadhani Ayu Fransiska Delifah, Nur Dermawan, Jozu Dzaky Abdillah Salafy Eka Pandu Cynthia, Eka Pandu El Saputra, Yoga Elin Haerani Elvia Budianita Fahrezy, Irgi Faizah Husniah Fauzan Ray T Fauzi Ihsan Febi Yanto Febrian Rizki Adi Sutiyo Fitri Insani Fitri Insani Fitri Wulandari Fitri, Dina Deswara Fuji Astuti Habib Hakim Sinaga Hadi, Mukhlis Halimah Hasibuan, Ilham Habibi Heru Wibowo Idhafi, Zaky Iffa, Marwika Rifattul Ihsan, Miftahul Iis Afrianty Iis Afrianty Iis Afrianty Iis Afrianty Illahi, Ridho Iman Fauzi Aditya Sayogo Indri Pangestuti Iwan Iskandar Jasril Jasril Jasril Jasril Jasril Jasril Lestari Handayani Lubis, Anggun Tri Utami BR. Miftah Farid Muhammad Fikry Muhammad Fikry Muhammad Iqbal Maulana Muhammad Irsyad Muhammad Irsyad Muhammad Ravil Muktar Sahbuddin Mukti M Kusairi Mulyadi, Syahrul Nadila Handayani Putri naldi, Afri Nazir, Alwis Nazruddin Safaat Nazruddin Safaat H Nazruddin Safaat H Negara, Benny Sukma Novriyanto Novriyanto Novriyanto Nurul Fatiara Oktavia, Lola Pangestu, Yoga Pizaini Pizaini Pranata, Joni Prima Yohana Putri Zahwa Putri, Adilah Atikah Putri, Atika Rahmad Abdillah Rahmad Kurniawan Ramadhani, Siti Reski Mai Candra Reski Mai Candra Rizqa Raaiqa Bintana Safrizal, Afri Naldi Salam Kurniawan Saputra, Ikhsan Dwi Saputra, M Ridho Saputra, Nugroho Wahyu Sinaga, Habib Hakim Siska Kurnia Gusti Siti Ramadhani Siti Ramadhani Siti Ramadhani Sri Puji Utami A. Subhi, Yazid Abdullah Suci Rahayu Sulistia Ningsih, Sulistia Suwanto Sanjaya Syaiful Azhar Trya Ayu Pratiwi Utari, Roid Fitrah Yusra Yusra Yusra, Yusra