Jurnal Simantec
Vol 4, No 2 (2014)

PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY

Andry Kurniawan (Unknown)
Firdaus Solihin (Unknown)
Fika Hastarita (Unknown)



Article Info

Publish Date
02 May 2016

Abstract

ABSTRAKBanyak informasi beasiswa yang ada di internet, di satu sisi memunculkan kesulitan bagi para pencari beasiswa untuk mendapatkan informasi beasiswa. Konsep sistem pencarian berbasis information retrieval (IR), dapat digunakan untuk proses mencari informasi beasiswa melalui media internet. Pembangunan IR pada penelitian ini menggunakan konsep vector space model (VSM). Untuk pengumpulkan data informasi beasiswa menggunakan Web Crawler, hasil dari proses crawling akan disimpan ke dalam basis data. Aplikasi Web Crawler yang digunakan adalah Web Crawler Vietspider. Kesamaan data beasiswa yang akan diintegrasikan oleh cosine similarity. Dengan menggunakan cosine similarity untuk membentuk data beasiswa yang relevan satu sama lain yang dibutuhkan oleh user berdasarkan query yang dimasukkan. Berdasarkan hasil dari pengujian sistem, didapatkan nilai minimal cosine similarity paling baik adalah threshold 0,1. Dengan rata-rata presentase nilai f-measure atau tingkat efisiensi kinerja sistem ini mencapai 19,9 %.Kata kunci : Beasiswa, Information Retrieval, Vector Space Model, Web Crawler, Cosine Similarity.ABSTRACTMany a scholarship information available in the internet, on the other hand that makes difficult for seeker to find scholarship information. The concept of search system based information retrieval (IR) can be used for the process of searching for scholarship information via internet. The development of IR in this study uses the concept of vector space model (VSM). For the collecting data of scholarship information is using Web Crawler, the results of crawling process are stored in the basis data. The applications that use a web crawler is a web crawler vietspider. The similarity of scholarship data is to be integrated by the cosine similarity to form a scholarship of data relevant to each other is needed by user based on the query entered. Based on the results of the testing system, the score of at least the most well cosine similarity threshold is 0.1. The average percentage value of the f-measure system performance or the level of efficiency reached 19.9%.Keyword: Scholarship, Information Retrieval, Vector Space model, Web Crawler, Cosine Similarity.

Copyrights © 2014






Journal Info

Abbrev

simantec

Publisher

Subject

Computer Science & IT

Description

Jurnal Simantec merupakan Jurnal Ilmiah dibawah naungan Program Studi Manajemen Informatika, Fakultas Teknik Universitas Trunojoyo Madura. Jurnal Simantec diterbitkan pertama kali pada bulan Desember 2009, dan diterbitkan dua kali dalam setahun. Jurnal Simantec berisi artikel-artikel ilmiah yang ...