Claim Missing Document
Check
Articles

Found 2 Documents
Search

Penerapan TF-IDF dan Cosine Similarity dalam Chatbot Virtual Asisten: Studi Kasus Layanan Informasi Pendaftaran Sekolah Menengah Pertama Bhagas Shaib Pramono; Muhammad Alwi Nur Fathihah; Muhammad Azizul Dzikri3; Maulana Cakra Dwi Noto
Prosiding Sains dan Teknologi Vol. 4 No. 1 (2025): Seminar Nasional Sains dan Teknologi (SAINTEK) ke 4 - Februari 2025
Publisher : DPPM Universitas Pelita Bangsa

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Sistem chatbot pendaftaran sekolah ini menggunakan teknologi AI berbasis Natural Language Processing (NLP) untuk mengotomatisasi layanan informasi pendaftaran. Dibangun dengan Flask dan scikit-learn, sistem ini mengolah teks pengguna dengan algoritma TF-IDF dan Cosine Similarity untuk mencocokkan pertanyaan dengan basis pengetahuan. Proses dimulai dengan preprocessing teks, diikuti dengan vektorisasi untuk representasi numerik dan perhitungan kesamaan semantik. Chatbot ini dapat menyesuaikan respons berdasarkan intent pengguna, dengan threshold similaritas 0.3. Fitur tambahan termasuk kemampuan menambah data QA secara dinamis, evaluasi performa, integrasi Telegram, dan antarmuka web untuk manajemen, hasil akurasi test case mendapatkan nilai 94.94%. Sistem ini tidak hanya
Analisis Sentimen Pada Teknologi 5G Menggunakan Algoritma Random Forest dan Naïve Bayes dengan Dataset Multibahasa Muhammad Alwi Nur Fathihah; Amali; Majid, Annisa Maulana
CESS (Journal of Computer Engineering, System and Science) Vol. 10 No. 2 (2025): Juli 2025
Publisher : Universitas Negeri Medan

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.24114/cess.v10i2.66502

Abstract

Perkembangan teknologi 5G sebagai generasi terbaru jaringan nirkabel telah menimbulkan beragam tanggapan publik, baik yang mendukung maupun yang menolak. Penelitian ini bertujuan untuk menganalisis sentimen masyarakat terhadap teknologi 5G berdasarkan komentar pengguna YouTube dalam bahasa Indonesia dan Inggris. Data diperoleh menggunakan teknik web crawling, kemudian diproses melalui tahapan SEMMA, yang mencakup preprocessing, pelabelan sentimen, dan pelatihan model. Dua algoritma yang digunakan adalah Random Forest dan Naïve Bayes. Evaluasi dilakukan menggunakan confusion matrix dan metrik seperti akurasi, precision, recall, dan F1-score. Hasil menunjukkan bahwa Random Forest memiliki performa yang lebih baik dengan akurasi 94,8% dan mampu mengklasifikasikan sentimen positif dan negatif secara seimbang. Sementara itu, Naïve Bayes cenderung bias terhadap sentimen positif dan memiliki kelemahan dalam mendeteksi komentar negatif. Penelitian ini menunjukkan bahwa Random Forest lebih andal untuk analisis sentimen multibahasa, khususnya dalam konteks opini publik terhadap teknologi 5G.