Claim Missing Document
Check
Articles

Found 2 Documents
Search
Journal : ILKOMNIKA: Journal of Computer Science and Applied Informatics

Pengukuran Kemiripan berbasis Leksikal dan Semantik untuk Perangkingan Dokumen Berbahasa Arab Syadza Anggraini; Diana Purwitasari; Agus Zainal Arifin
ILKOMNIKA: Journal of Computer Science and Applied Informatics Vol 4 No 2 (2022): Volume 4, Nomor 2, Agustus 2022
Publisher : Lembaga Penelitian dan Pengabdian Masyarakat

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.28926/ilkomnika.v4i2.495

Abstract

Hasil pencarian relevan pada sistem temu kembali informasi tergantung pengukuran kemiripan antara query dan dokumen berdasarkan bobot kata query terhadap dokumen yang akan dirangking. Namun, perhitungan kemiripan menggunakan bobot kata dimungkinkan adanya lafal kata yang berbeda tetapi memiliki makna sama. Hasil dokumen pencarian teks berbahasa Arab akan dipengaruhi kemampuan pengguna yang beragam dalam memahami bahasa tersebut. Oleh karena itu diusulkan pengukuran kemiripan secara leksikal untuk mengatasi lafal kata yang beda serta juga menggunakan kemiripan secara semantik untuk mengenali kata dengan makna sama. Penggabungan perhitungan kemiripan leksikal dan semantik dilakukan berdasarkan bobot kata (secara leksikal) yang digabungkan dengan word embedding (secara semantik). Hasil dari uji coba dilakukan pada 2900 kitab berbahasa Arab Maktabah Syamilah menunjukkan keunggulan dengan rata-rata f-measure tertinggi dibandingkan metode lainnya yaitu 66.7% pada keseluruhan query, serta 65.2% dan 69% pada short query dan long query. Short query adalah frekuensi jumlah kata di dalam query yang berjumlah 1-2 kata sedangkan long query adalah frekuensi jumlah kata di dalam query yang berjumlah lebih dari 2 kata. Short query dan long query berpeluang me-retrieve dokumen yang tidak relevan. Hasil retrieve dokumen yang tidak relevan disebabkan karena rendahnya kemiripan antar kata di dalam suatu query akibat pemilihan kata yang kurang tepat. Pemilihan kata-kata query membutuhkan penguasaan pengguna yang tidak hanya mampu mengolah query dalam bahasa Arab, tetapi juga dapat memahami konteks dokumen yang akan dicari.
Peringkasan Hybrid Teks Berita Bahasa Indonesia Berbasis Improved TextRank dan Transformer Anggraini, Syadza; Impron, Ali; Sutriani, Linda; Putra, Kurniawan Tri
ILKOMNIKA Vol 7 No 3 (2025): Volume 7, Number 3, December 2025
Publisher : Lembaga Penelitian dan Pengabdian Masyarakat

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.28926/ilkomnika.v7i3.806

Abstract

Peringkasan teks otomatis berbahasa Indonesia masih menghadapi tantangan dalam menghasilkan ringkasan yang informatif namun tetap koheren secara semantik. Sebagian besar penelitian sebelumnya hanya menggunakan metode ekstraktif seperti TextRank atau metode abstraktif seperti mT5-small tanpa mengoptimalkan hubungan semantik antar kalimat. Terdapat masalah di antaranya metode ekstraktif cenderung kaku dan tidak mengubah susunan kata dalam kalimat, sedangkan metode abstraktif bisa menyebabkan risiko kesalahan fakta ataupun output yang kurang relevan jika teks terlalu panjang. Untuk mengatasi masalah tersebut tersebut, penelitian ini mengusulkan metode peringkasan teks hybrid yang menggabungkan Improved TextRank dengan mT5-small. Pada tahap awal, dilakukan praproses dan ekstraksi kalimat dengan representasi semantik berbasis embedding. Hasil ekstraksi dimasukkan sebagai input di model mT5-small untuk menghasilkan ringkasan secara abstractive melalui proses parafrasa dan penyusunan ulang kalimat. Penelitian dilakukan terhadap 1000 dokumen berita dataset IndoSum dengan metrik evaluasi ROUGE. Hasil evaluasi menunjukkan bahwa metode usulan mencapai nilai ROUGE sebesar 0.687, 0.451, dan 0.634, melampaui performa TextRank klasik 0.472, 0.307, 0.441 dan mT5-Small 0.553, 0.362, 0.508 untuk hasil evaluasi ROUGE 1, 2 dan L secara berturut-turut. Hasil ini membuktikan bahwa integrasi sentence embedding dan pendekatan hybrid efektif meningkatkan kualitas ringkasan dari segi relevansi semantik. Sehingga pendekatan ini berpotensi menjadi dasar pengembangan model peringkasan teks Bahasa Indonesia yang lebih robust dan semantik.