Jurnal Tekno Kompak
Vol 14, No 2 (2020): AGUSTUS

PERBANDINGAN KINERJA WORD EMBEDDING WORD2VEC, GLOVE, DAN FASTTEXT PADA KLASIFIKASI TEKS

Arliyanti Nurdin (Institut Teknologi Telkom Surabaya)
Bernadus Anggo Seno Aji (Institut Teknologi Telkom Surabaya)
Anugrayani Bustamin (Universitas Hasanuddin)
Zaenal Abidin (Universitas Teknokrat Indonesia)



Article Info

Publish Date
15 Aug 2020

Abstract

Karakteristik teks yang tidak terstruktur menjadi tantangan dalam ekstraksi fitur pada bidang pemrosesan teks. Penelitian ini bertujuan untuk membandingkan kinerja dari word embedding  seperti Word2Vec, GloVe dan FastText dan diklasifikasikan dengan algoritma Convolutional Neural Network. Ketiga metode ini dipilih karena dapat menangkap makna semantik, sintatik, dan urutan bahkan konteks di sekitar kata jika dibandingkan dengan feature engineering tradisional seperti Bag of Words. Proses word embedding dari metode tersebut akan dibandingkan kinerjanya pada klasifikasi berita dari dataset 20 newsgroup dan Reuters Newswire. Evaluasi kinerja diukur menggunakan F-measure. Performa terbaik menunjukkan FastText unggul dibanding dua metode word embedding lainnya dengan nilai F-Measure  sebesar 0.979 untuk dataset 20 Newsgroup dan 0.715 untuk Reuters. Namun, perbedaan kinerja yang tidak begitu signifikan antar ketiga word embedding tersebut menunjukkan bahwa ketiga word embedding ini memiliki kinerja yang kompetitif. Penggunaannya sangat bergantung pada dataset yang digunakan dan permasalahan yang ingin diselesaikan.Kata kunci: word embedding, word2vec, glove, fasttext, klasfikasi teks, convolutional neural network, cnn.

Copyrights © 2020






Journal Info

Abbrev

teknokompak

Publisher

Subject

Computer Science & IT

Description

Jurnal Tekno Kompak adalah jurnal Sistem Informasi dan Komputer Akuntansi yang menerbitkan artikel-artikel ilmiah secara berkala enam bulanan setiap bulan Februari dan Agustus. ...