Garuda - Garba Rujukan Digital

Jurnal Tekno Kompak

Vol 14, No 2 (2020): AGUSTUS

Arliyanti Nurdin (Institut Teknologi Telkom Surabaya)
Bernadus Anggo Seno Aji (Institut Teknologi Telkom Surabaya)
Anugrayani Bustamin (Universitas Hasanuddin)
Zaenal Abidin (Universitas Teknokrat Indonesia)

Publish Date
15 Aug 2020

Karakteristik teks yang tidak terstruktur menjadi tantangan dalam ekstraksi fitur pada bidang pemrosesan teks. Penelitian ini bertujuan untuk membandingkan kinerja dari word embedding seperti Word2Vec, GloVe dan FastText dan diklasifikasikan dengan algoritma Convolutional Neural Network. Ketiga metode ini dipilih karena dapat menangkap makna semantik, sintatik, dan urutan bahkan konteks di sekitar kata jika dibandingkan dengan feature engineering tradisional seperti Bag of Words. Proses word embedding dari metode tersebut akan dibandingkan kinerjanya pada klasifikasi berita dari dataset 20 newsgroup dan Reuters Newswire. Evaluasi kinerja diukur menggunakan F-measure. Performa terbaik menunjukkan FastText unggul dibanding dua metode word embedding lainnya dengan nilai F-Measure sebesar 0.979 untuk dataset 20 Newsgroup dan 0.715 untuk Reuters. Namun, perbedaan kinerja yang tidak begitu signifikan antar ketiga word embedding tersebut menunjukkan bahwa ketiga word embedding ini memiliki kinerja yang kompetitif. Penggunaannya sangat bergantung pada dataset yang digunakan dan permasalahan yang ingin diselesaikan.Kata kunci: word embedding, word2vec, glove, fasttext, klasfikasi teks, convolutional neural network, cnn.

Citation Download

EndNote, Reference Manager, ProCite

Latex, Jabref

Check in Google Scholar

Journal Info

Jurnal Tekno Kompak

Website

Abbrev

teknokompak

Publisher

Universitas Teknokrat Indonesia

Subject

Computer Science & IT

Description

Jurnal Tekno Kompak adalah jurnal Sistem Informasi dan Komputer Akuntansi yang menerbitkan artikel-artikel ilmiah secara berkala enam bulanan setiap bulan Februari dan Agustus. ...

Article Info

Abstract

PERBANDINGAN KINERJA WORD EMBEDDING WORD2VEC, GLOVE, DAN FASTTEXT PADA KLASIFIKASI TEKS

Article Info

Abstract