Claim Missing Document
Check
Articles

Perbandingan Algoritma K-Nearest Neighbor dan Logistic Regression pada Analisis Sentimen terhadap Vaksinasi Covid-19 pada Media Sosial Twitter dengan Pelabelan Vader dan Textblob Fazrin, Fadhilah; Pratiwi, Oktariani Nurul; Andreswari, Rachmadita
eProceedings of Engineering Vol. 10 No. 2 (2023): April 2023
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak— Pada analisis ini metode yang digunakan yaitu metode klasifikasi K-Nearest Neighbor dan metode klasifikasi Logistic Regression dengan data yang diambil pada aplikasi twitter. Penelitian ini mengkaji tingkat akurasi pada sentimen masyarakat mengenai vaksinasi Covid-19 dengan label positif dan negatif. Nilai AUC pada algoritma KNN dengan pelabelan TextBlob yaitu sebesar 0,765 dengan dan 0,768 untuk pelabelan VaderSentiment keduanya termasuk kedalam kriteria fair classification. Sementara itu, pada algoritma Logistic Regression menghasilkan akurasi sebesar 84,97% dengan perbandingan rasio 90:10 untuk pelabelan TextBlob, sementara untuk pelabelan VaderSentiment dengan perbandingan rasio 90:10 menghasilkan akurasi sebesar 85,22%. Kedua algoritma divalidasi menggunakan K-Fold Cross Validation dengan jumlah fold 10. Hasil perbandingan yang diperoleh saat melakukan evaluasi dengan confusion matrix menunjukkan bahwa algoritma Logistic Regression dengan pelabelan VaderSentiment memiliki nilai akurasi yang paling tinggi dibandingakan dengan algoritma K-Nearest Neighbor dengan pelabelan TextBlob dan VaderSentiment. Kata kunci—vaksinasi covid-19, k-nearest neighbor, logistic regression, analisis sentimen
Analisis Sentimen Review Pengguna Website IMDB Menggunakan Klasifikasi Naïve Bayes Kardila, Yuni; Pratiwi, Oktariani Nurul; Hamami, Faqih
eProceedings of Engineering Vol. 10 No. 3 (2023): Juni 2023
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak-Website IMDB (Internet Movie Database) merupakan suatu web yang digunakan untuk menyediakan atau melihat berbagai informasi tentang jutaan film yang telah tayang, yang digunakan untuk melihat review, rating, pemeran dan kru dari film tersebut. Para pengguna baru biasanya suka melihat review pengguna lainnya sebelum menentukan film apa yang akan mereka tonton, namun semakin banyak dan semakin besar review yang diberikan akan semakin besar dampak penilaian tersebut terhadap keputusan para pengguna baru, sehingga apabila para pengguna baru tidak dapat mengartikan makna dari review yang diberikan, untuk mengatasi hal tersebut dilakukanlah analisis sentimen. Penelitian yang dilakukan kali ini bertujuan untuk menganalisa analisis sentimen terhadap movie review yang diberikan oleh pengguna website IMDB, dengan menggunakan algoritma Naïve Bayes Multinomial. Penelitian ini juga menggunakan text preprocessing, dan TF-IDF untuk meningkatkan nilai akurasi dari model tersebut. Hasil evaluasi menggunakan confusion matrix menunjukan nilai accuracy 88.93%, nilai precision 89.07%, nilai recall sebesar 89.14% dan nilai F1-Score 89.11%, dengan perbandingan data training dan testing 70:30. Hasil klasfikasi yang dilakukan menghasilkan data 7533 berlabel positif dan 7249 berlabel negatif, nilai tersebut menunjukan sebagian besar para pengguna IMDB berkomentar positif terhadap film yang mereka tonton.Kata kunci-Naïve Bayes, IMDb, sentiment analysis, text preprocessing
Klasifikasi Review Customer Di E-Commerce Bukalapak Menggunakan Metode Support Vector Machine (SVM) Chrisdiyanti, Ivania Nonita; Fa'rifah, Riska Yanua; Pratiwi, Oktariani Nurul
eProceedings of Engineering Vol. 10 No. 3 (2023): Juni 2023
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak-Bukalapak menempati urutan ketiga dalam top 10 e-commerce Indonesia, tujuan pemeringkatan tersebut yaitu agar pihak Bukalapak dapat meningkatkan kualitas dan kuantitas layanannya. Mengklasifikasi review dari customer Bukalapak yang terlalu banyak membutuhkan waktu yang lama jika dilakukan dengan cara manual. Dibutuhkan suatu metode yang dapat mengklasifikasikan customer review. Metode yang digunakan untuk mengkasifikasikan review adalah Support Vector Machine. Review akan diklasifikasi menjadi dua jenis yaitu positif dan negatif review. Tahapan untuk melakukan klasifikasi pada penelitian ini adalah preprocessing data, ekstraksi fitur dengan TF-IDF, analisis SVM, dan evaluasi.Terdapat 3 skenario yang digunakan dalam penelitian ini, yaitu perbandingan 60:40, 70:30, dan 80:20. Hasil klasifikasi dengan SVM dan fungsi kernel linier pada data training menunjukkan bahwa ketiga rasio mempunyai akurasi dari model terbaik yang dibentuk oleh SVM adalah rasio 60:40. Evaluasi dari model terbaik dari SVM didapatkan akurasi sebesar 85%, Recall sebesar 79%, Precision 89%, dan F1-Score sebesar 84%. Hasil dari K-Fold Cross Validation dengan 10 Fold menunjukkan hasil yang tidak jauh berbeda dari evaluasi yaitu rata-rata sebesar 84%. Hasil klasifikasi kategori positif dapat dijadikan acuan untuk mempertahankan kualitas layanan dan hasil klasifikasi negatif dapat digunakan sebagai bahan evaluasi dalam meningkatkan layanan di Bukalapak.Kata kunci- customer review klasifikasi, SVM, kernel linear
Klasifikasi Review Customer E-Commerce Menggunakan Metode K-Nearest Neighbor (Studi Kasus: Bukalapak) Pramuwidya, Shinta; Fa'rifah, Riska Yanu; Pratiwi, Oktariani Nurul
eProceedings of Engineering Vol. 10 No. 3 (2023): Juni 2023
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak- Melihat persaingan e-commerce yang semakin ketat saat ini membuat Bukalapak melakukan berbagai upaya agar dapat bertahan serta meningkatkan kualitas layanan terhadap konsumen. Salah satu cara yang dapat dilakukan adalah melakukan evaluasi dari hasil review. Untuk dapat mengambil sebuah keputusan dari hasil review langkah yang perlu diambil salah satunya dengan mengklasifikasikan review dengan bertujuan untuk mengkategorikan data terhadap komentar atau review sehingga dapat membantu pelaku usaha dalam menarik kesimpulan terkait kecenderungan komentar. Dataset yang telah dikumpulkan dilakukan preprocessing sehingga berjumlah sebanyak 87.241 data. Di karenakan data memiliki missing value maka diatasi dengan metode imputasi menggunakan mode(). Setelah mengatasi missing value, dataset dihitung pembobotannya dengan tfidfVectorizer, selanjutnya di resampling dengan SMOTE agar data seimbang. Review dianalisis dengan algoritma K-Nearest Neighbors dengan tiga skenario yaitu 60:40, 70:30, dan 80:20, serta memiliki tiga jenis k_neighbors yaitu k=3, k=5 dan k=7. Jarak yang digunakan pada penelitian ini adalah Euclidean. Hasil analisis menunjukan bahwa KNN terbaik ada pada rasio training dan testing 80:20 dengan k=3. Hasil analisis menunjukan hasil evaluasi sebesar 76,42%. Hasil klasifikasi dengan KNN menunjukan komentar negatif lebih banyak daripada yang positif. Dari hasil penelitian ini diharapkan dapat dijadikan bahan evaluasi bagi Bukalapak untuk meningkatkan kualitas layanan.Kata kunci- klasifikasi, K-Nearest neighbors, euclidean
A Systematic Literature Review on AI and NLP Applications for Customer Support Automation and Digital Service Yulio Ferdinand; Muharman Lubis; Oktariani Nurul Pratiwi
International Journal of Computer Technology and Science Vol. 2 No. 4 (2025): International Journal of Computer Technology and Science
Publisher : Asosiasi Riset Teknik Elektro dan Infomatika Indonesia

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.62951/ijcts.v2i4.317

Abstract

This study presents a Systematic Literature Review on Artificial Intelligence (AI) and Natural Language Processing (NLP) applications for customer support automation and digital service optimization. The review follows the PRISMA framework to ensure methodological rigor and transparency, focusing on literature published between 2020 and 2025 from the Scopus database. The findings reveal that AI-driven technologies, including Machine Learning, Deep Learning, and Large Language Models, have significantly improved efficiency, response time, and customer satisfaction in customer support and digital service. Common NLP applications include sentiment analysis, ticket classification, and automated response generation. Among these, hybrid and transformer-based models demonstrate superior accuracy and contextual understanding compared to traditional algorithms. However, several challenges persist, including data quality limitations, privacy and security concerns, algorithmic bias, and linguistic ambiguities such as sarcasm and negation. Moreover, issues related to trust and ethical adoption continue to influence user acceptance of AI systems. This review provides a comprehensive synthesis of current methodologies, trends, and research gaps, offering insights for future studies to develop explainable, secure, and human-centered AI systems that enhance the sustainability and transparency of digital customer support services.
Analysis of Resilience of Education System in Higher Education Due to Covid-19 Pandemic in Indonesia: A Systematic Literature Review Widiartha, Ida Bagus Ketut; Hwang, Jun-seok; Yoon, Hyoen-yeong; Pratiwi, Oktariani Nurul
JOIV : International Journal on Informatics Visualization Vol 7, No 2 (2023)
Publisher : Society of Visual Informatics

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.30630/joiv.7.2.1814

Abstract

This study discusses learning strategies resilience that can be used to improve learning outcomes during the current pandemic circumstances, which have limitations in face-to-face learning. Online learning has many limitations compared to offline one. However, it must keep running because one of the strategies against the SAR-Cov2 virus is to inhibit its spread by limiting direct contact with other people. The literature review is carried out with a protocol involving text mining tools to find the most widely used keywords and their relationships, which is then carried out by a snowball literature review to deepen these keywords. There are several findings from this study, namely (1) Three critical components that play a significant role in improving learning outcomes in the distance learning method, namely the role of students, lectures, and technology. (2) A framework must ensure that the other three components perform their functions properly and provide an effective learning environment. (3) Reward and punishment play a vital role in ensuring the framework is implemented as it should be. Integrating an effective learning environment with remuneration programs and teaching grants will encourage improvements in the learning process and increase the number of positive contents on the Internet. This learning environment can also be a model that supports independent learning activities - an independent campus, the Ministry of Education and Culture of the Republic of Indonesia's flagship program, and digital commercialization in the educational sphere.
Pengembangan Aplikasi Sistem Presensi Guru dan Siswa berbasis Web Menggunakan Framework Python Django pada SMA Bina Negara 1 Baleendah Pratiwi, Oktariani Nurul; Rahmadania, Fitri; Rizqi, Nabilla Noor; Zuhairnawan, Raffi Ihza; Al Faruq, Muhammad Za'im; Albari, Fatih
Jurnal Pengabdian Masyarakat Bangsa Vol. 3 No. 10 (2025): Desember
Publisher : Amirul Bangun Bangsa

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.59837/jpmba.v3i10.3550

Abstract

Pengembangan sistem presensi berbasis web di SMA Bina Negara 1 Baleendah dilakukan untuk menjawab permasalahan inefisiensi yang muncul akibat penggunaan sistem semi-digital yang tersebar di berbagai platform. Kondisi tersebut menyebabkan proses pencatatan kehadiran membutuhkan verifikasi manual yang memakan waktu, data presensi sering tidak sinkron, serta laporan harian sulit diperoleh secara cepat. Untuk mengatasi permasalahan tersebut, penelitian ini mengembangkan aplikasi presensi terintegrasi menggunakan framework Django versi 5.1.3, yang dipilih karena stabilitas, keamanan, serta kelengkapan fitur autentikasi dan pengelolaan pengguna. Metode pengembangan meliputi analisis kebutuhan, perancangan alur kerja presensi, pembuatan antarmuka untuk berbagai peran pengguna, pengembangan sistem backend, serta uji coba bersama kepala sekolah, guru, dan staf Tata Usaha. Hasil implementasi menunjukkan peningkatan efisiensi yang signifikan, terutama pada proses verifikasi kehadiran yang sebelumnya memerlukan waktu lima hingga enam jam per hari dan kini dapat dilakukan secara real time melalui dashboard terpusat. Sistem ini tidak hanya menyederhanakan proses administratif, tetapi juga meningkatkan akurasi pencatatan presensi serta menyediakan dasar bagi pengembangan fitur lanjutan di masa depan, sehingga mendukung percepatan transformasi digital sekolah secara berkelanjutan.
Classification of High School History Questions Based on Cognitive Level Revised Bloom's Taxonomy Using K-Nearest Neighbor Method Salma, Farah Sherina; Pratiwi, Oktariani Nurul; Fa’rifah, Riska Yanu
Jurnal Sistem Cerdas Vol. 8 No. 2 (2025)
Publisher : APIC

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.37396/jsc.v8i2.254

Abstract

Education plays an important role in transmitting knowledge to its students and to measure how well the student understands, testing is needed based on the cognitive level of knowledge. In measuring the cognitive level, it can be applied with reference to the Revised Bloom's Taxonomy which explains the regulation of learning processes and targets. Then by testing knowledge through the questions that have been made, it is necessary to classify the questions into several cognitive levels according to Revised Bloom's Taxonomy to determine the learning process and understanding of each individual. Many types of questions that are formed make classification difficult because the method is still done manually, therefore machine learning is needed. This study will focus on the classification of questions from the History subject in high school. The dataset used is downloaded from internet searches of USBN, PAS, PTS, and other exams. This study focuses on RBT C4 to C6 only. This study uses the K-Nearest Neighbor algorithm to obtain accuracy and with the imbalance of data in the dataset, an oversampling method using SMOTE will also be used. The accuracy results obtained are precision is 76%, recall is 76%, f1-score is 74%, accuracy is 76%. Keywords—question classification, KNN, high school history, SMOTE, RBT, oversampling
Implementasi GenAI dalam Sistem Pembuatan Butir Soal Otomatis dengan Pendekatan Microservices Herdian, Hafiizh; Pratiwi, Oktariani Nurul; Hamami, Faqih
eProceedings of Engineering Vol. 10 No. 1 (2023): Februari 2023
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Pembuatan soal yang relevan, bervariasi, dan sesuai dengan kurikulum merupakan tantangan besar bagi tenaga pengajar, terutama dengan keterbatasan waktu dan beban kerja administratif. Penelitian ini bertujuan mengembangkan sistem pembuatan butir soal otomatis berbasis Generative Artificial Intelligence (GenAI) dengan model Gemini 1.5 Flash dan pendekatan arsitektur microservices. Sistem menghasilkan soal pilihan ganda dan isian singkat dari input materi berupa teks, PDF, atau dokumen. Pengembangan dilakukan menggunakan metodologi Extreme Programming (XP) dengan implementasi teknologi Next.js, TypeScript, PostgreSQL, Docker, dan RabbitMQ. Hasil menunjukkan sistem mampu menghasilkan 10 soal dengan waktu rata-rata 8,5 detik dan menyediakan layanan modular, skalabel, serta responsif terhadap perubahan kebutuhan pengguna. Validasi dilakukan uji fungsional dan observasi pengguna (user acceptence test), serta menunjukkan efektivitas dan efisiensi sistem dalam konteks pendidikan digital. Kata kunci— generative AI, Gemini 1.5 Flash, pembuatan soal otomatis, microsevices, XP
Multi-Output Classification of Cognitive Levels and Topics in Indonesian Questions using Deep Learning and Transformers Orvalamarva, Orvalamarva; Pratiwi, Oktariani Nurul; Fakhrurroja, Hanif
International Journal of Advances in Data and Information Systems Vol. 7 No. 1 (2026): April 2026 - International Journal of Advances in Data and Information Systems
Publisher : Indonesian Scientific Journal

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.59395/ijadis.v7i1.1492

Abstract

Managing large-scale digital question banks struggles with manual metadata labeling, especially when identifying material topics and cognitive levels based on the Revised Bloom's Taxonomy. Current automated approaches usually treat these two attributes as separate tasks, which adds to the system's complexity and computational load. This study introduces a multi-output classification method using a shared encoder architecture with two task-specific heads to predict topics and cognitive levels simultaneously. We performed experiments on 685 Indonesian junior high science questions, covering 15 topic labels and four cognitive levels (C1–C4), with an imbalanced distribution in which lower cognitive levels accounted for more than 75% of the dataset. To handle this imbalance, we applied Focal Loss to taxonomy classification, and class weighting was used in the comparison model. A comparative study involved CNN, BiLSTM, DistilBERT, and IndoBERT. Our results demonstrate that IndoBERT delivered the best performance, with F1-macro scores of 0.78 for topics and 0.71 for cognitive levels and showed better performance in minority classes compared to standard cross-entropy-based models. These findings suggest that an integrated multi-output approach can boost the efficiency and accuracy of question labeling and offers potential for integration into Computer-Based Test systems and e-assessment platforms in real time.
Co-Authors Adnyana, I Gusti Ngurah Bagus Putra Agustiana, Nathifa Al Faruq, Muhammad Za'im Albari, Fatih Alfian Akbar Gozali Alyasyifa, Salma Anindya Prameswari Putri Djakaria Anshari, Faishal Mufied Al Ariandi, Rama Asriana Asriana, Asriana Azka Chanda Milanesta Bagaskara, Kumara Ris Panji Cahyani, Pradita Chika Enggar Puspita Chrisdiyanti, Ivania Nonita Cynthia Ayu Prayuning Deden Witarsyah Djakaria, Anindya Prameswari Putri Eflin Trinova Limbong Fa'rifah, Riska Yanu Fa'rifah, Riska Yanua Fakhrurroja, Hanif Faqih Hamami Fazrin, Fadhilah Firzania, Heidea Yulia Gosal, Yose Thimothy Hadwirianto, Muhammad Raihan Hanid, Wihda Sifwi Herdian, Hafiizh Hilman Dwi Anggana Hwang, Jun-seok I B K Widiartha Ilham Perdana Iqbal Yulizar Mukti Irfan Darmawan Jesika Damayanti Doloksaribu Jessica Inas Rasendriya Josia Fortino Pakpahan Kamil, Andhika Ihsan Kardila, Yuni Kasparov, Michael Christensen Bonar Kurniawan, Muhammad Rayhan Mardika, Jody Muhaimin, Luthfi Ahmad Muhamad Insan Taufik Muhammad Naufal Fikri Muharman Lubis Mustada, Fitrina Annisa Nabila Ramadhania Nisa, Amarila Zahratun Novanza, Alvin Renaldy Nur Ichsan Utama Nuraliza, Hilda Orvalamarva Orvalamarva, Orvalamarva Pramudia, Rudi Guna Pramuwidya, Shinta R. Rama Ahmad Waliyya Rachmadita Andreswari Rahmadania, Fitri Reihaini Fikria Bunga Oktaviani Revanda Octavian Rizqi, Nabilla Noor Rukmana, Putri Utami Saleh Hasan Badjrie Salma, Farah Sherina Sutoyo, Edi Talisman, Bryan Ronald Taufiq Hamdani Yunan Yoon, Hyoen-yeong Yulio Ferdinand Zuhairnawan, Raffi Ihza