Prosiding SEMNAS INOTEK (Seminar Nasional Inovasi Teknologi)
Vol. 9 No. 1 (2025): Prosiding Seminar Nasional Inovasi Teknologi Tahun 2025

Penerapan Regular Expression dan Cosine Similarity pada Uji Kemiripan Kalimat Bahasa Indonesia

Musta'in, Ahmad Dzaky Hafidz (Unknown)
Ardi Sanjaya (Unknown)
Ahmad Bagus Setiawan (Unknown)



Article Info

Publish Date
10 Jul 2025

Abstract

Penelitian ini membahas sistem analisis kemiripan kalimat menggunakan metode cosine similarity dengan fokus pada optimasi tahap pra-pemrosesan. Masalah utama yang diangkat adalah kebutuhan untuk mengenali pola angka Romawi dalam teks yang sering muncul dalam penamaan kelas atau bab dokumen. Metode yang digunakan melibatkan proses case folding, tokenizing, filtering, stemming, serta penggunaan regular expression untuk mendeteksi angka Romawi. Hasil pengujian menunjukkan sistem berhasil mengonversi angka Romawi dengan akurat. Namun, ditemukan kelemahan dalam konteks linguistik, seperti kesalahan interpretasi huruf pada nama khas daerah yang menyerupai pola angka Romawi. Hal ini menunjukkan perlunya integrasi pendekatan berbasis konteks untuk meningkatkan akurasi sistem. Untuk pengembangan lebih lanjut, disarankan penggunaan metode pembobotan tambahan atau pendekatan berbasis BERT guna meningkatkan pemahaman semantik kalimat.

Copyrights © 2025






Journal Info

Abbrev

inotek

Publisher

Subject

Computer Science & IT Control & Systems Engineering Decision Sciences, Operations Research & Management Electrical & Electronics Engineering Energy Engineering Industrial & Manufacturing Engineering Mathematics Mechanical Engineering Transportation

Description

Teknologi saat berkembang sangat cepat selama beberapa tahun terakir ini. Perkembangan teknologi tersebut merupakan salah satu dampak dari peningkatan inovasi dalam bidang teknologi. Ide-ide dan produk baru selalu ada untuk membantu kemingkatkan kualitas kehidpan manusia. Dalam rangka mendukung ...