E-Link: Jurnal Teknik Elektro dan Informatika
Vol 14 No 2 (2019)

Pemilihan Korpus Statis Bersesuaian dengan Cosine Similarity dan Penggunaan IDF Global Pada Penambahan Dokumen Baru

Utomo Pujianto (Universitas Muhammadiyah Gresik)
Arya Yudhi Wijaya (Universitas Muhammadiyah Gresik)



Article Info

Publish Date
12 Feb 2020

Abstract

Abstrak – Permasalahan yang muncul pada saat pembobotan menggunakan nilai “term frequency–inversedocument frequency” (tf-idf) adalah adanya kebutuhan untuk selalu melakukan perhitungan ulang nilai inversedocument frequency (idf) setiap kali dokumen baru ditambahkan ke dalam database. Hal ini menyebabkanpeningkatan kompleksitas komputasi menjadi O(N2). Untuk menangani masalah tersebut, dalam paper ini diusulkansebuah metode yang menggunakan cosine similarity dan sejumlah korpus statis yang telah didefinisikan sebelumnya.Cosine similarity digunakan untuk menghitung kemiripan nilai term frequency (tf) dokumen baru dengan reratanilai tf dari setiap korpus statis yang ada dalam database. Nilai idf dari korpus statis yang memiliki nilai similaritypaling tinggi dengan dokumen baru kemudian dipilih sebagai nilai idf dari dokumen yang baru. Hasil uji cobamenunjukkan bahwa tidak terdapat perbedaan yang signifikan antara nilai tf-idf yang dihitung dengan metode telahada sebelumnya dengan metode yang diusulkan dalam paper ini. Dengan kata lain, metode ini dapatdipertimbangkan sebagai alternatif penentuan nilai idf, terutama karena kompleksitasnya yang hanya O(N).

Copyrights © 2020






Journal Info

Abbrev

e-link

Publisher

Subject

Computer Science & IT Control & Systems Engineering Electrical & Electronics Engineering Energy

Description

E-Link : Jurnal Teknik Elektro dan Informatika yang dikelola oleh Prodi Teknik Elektro Universitas Muhammadiyah Gresik, Jurnal ini sudah terbit semenjak tahun 2007, tetapi mengalami perubahan E-ISSN pada tahun 2019. E-Link berisi karya-karya Ilmiah Teknik / Rekayasa dibidang Elektro dan Informatika ...