Jurnal Teknoinfo
Vol 17, No 2 (2023): Vol 17, No 2 (2023) : JULI

ANALISIS PERFORMANSI ENTITY MATCHING DENGAN FUZZY WUZZY PADA ARTIKEL FAIRNESS AI

Indira Salsabila Ardan (Institut Teknologi Sepuluh Nopember)
Miftakhul Janah Sulastri (Institut Teknologi Sepuluh Nopember)
Nur Aini Rakhmawati (Institut Teknologi Sepuluh Nopember)



Article Info

Publish Date
12 Jul 2023

Abstract

Dalam era digital saat ini, mencari informasi mengenai topik tertentu semakin mudah dilakukan melalui mesin pencari seperti Google Scholar atau database artikel ilmiah. Google Scholar memungkinkan pengguna untuk menemukan artikel atau jurnal ilmiah dari berbagai bidang ilmu serta berfungsi sebagai perpustakaan pribadi yang memungkinkan pengguna untuk menyimpan jurnal-jurnal terpilih. Namun, karena jumlah artikel ilmiah yang begitu banyak, sering kali sulit untuk menentukan artikel mana yang paling relevan dengan topik tertentu dan memiliki tingkat keakuratan yang tinggi. Salah satu teknik yang digunakan untuk memilih artikel ilmiah yang relevan dengan topik tertentu adalah dengan menggunakan entitymatching.Penelitian ini bertujuan untuk melakukan analisis performansi dari teknik entitymatching menggunakan FuzzyWuzzy dengan penambahan blocking stop wordremoval dan sizeblocking pada artikel bertema Fairness in AI. Teknikentitymatching dilakukan dengan membandingkan title dengan title, authors dengan authors, dan keywords dengan keywords. Pembobotanditerapkan pada title, authors, dan keywordsserta terdapat empat variasi pembobotan yang digunakan. Blocking juga diterapkan untuk meningkatkan kecepatan dan efisiensi teknikentitymatching.Hasil analisis menunjukkan bahwa bobot yang digunakan dalam teknikentitymatching memiliki peran penting dalam mencapai performa yang optimal. Bobot 0.5 untuk title, 0.1 untuk authors, dan 0.4 untuk keywords menghasilkan performa terbaik dengan accuracy sebesar 71.26%, recall sebesar 48.34%, precision sebesar 92.74%, dan f-1 score sebesar 63.56%. Selain itu, penerapan sizeblocking dapat mempercepat proses perbandingan data secara signifikan, dengan runningtime sebesar 2.56 detik tanpa mengorbankan performa. 

Copyrights © 2023






Journal Info

Abbrev

teknoinfo

Publisher

Subject

Computer Science & IT

Description

Jurnal Teknoinfo is a peer-reviewed scientific Open Access journal that published by Universitas Teknokrat Indonesia. This Journal is built with the aim to expand and create innovation concepts, theories, paradigms, perspectives and methodologies in the sciences of Informatics Engineering. The ...