Jurnal Pendidikan Teknologi dan Kejuruan
Vol. 21 No. 1 (2024): Edisi Januari 2024

IDENTIFIKASI DAN NORMALISASI TEKS SLANG DENGAN FASTTEXT PADA TWITTER DALAM BAHASA INDONESIA

pande sindu (Unknown)
Agus Aan Jiwa Permana (Unknown)
I Nyoman Saputra Wahyu Wijaya (Unknown)



Article Info

Publish Date
30 Jan 2024

Abstract

Salah satu dampak yang signifikan dari popularitas media sosial adalah munculnya istilah slang yang semakin banyak. Istilah slang adalah bahasa yang digunakan oleh kelompok-kelompok tertentu untuk berkomunikasi secara informal. Slang juga dapat muncul melalui singkatan, penggunaan kata-kata yang berbeda dari arti aslinya, atau penggabungan kata-kata yang tidak konvensional. Dalam pengolahan bahasa alami (Natural Language Processing) Slang sering kali memiliki makna yang tidak jelas atau ambigu, dan kata-kata slang dapat memiliki konotasi yang berbeda tergantung pada konteks dan subkultur tertentu. Ini dapat menyebabkan kesalahan dalam pemrosesan bahasa alami dan menghasilkan hasil yang tidak akurat atau salah dalam tugas seperti klasifikasi teks atau analisis sentimen. Dari permasalahan tersebut dalam penelitian ini dikembangkan suatu metode untuk mengidentifikasi dan melakukan normalisasi slang pada kalimat yang akan diproses oleh NLP. Proses normalisasi slang ke bahasa yang lebih standar dilakukan dengan memanfaatkan pretrain model dari fasttext untuk mencari kata – kata yang memiliki kedekatan dengan slang. Data yang digunakan pada penelitian ini didapatkan dari sosial media twitter. Sebelum dinormalisasi data melewati beberapa proses seperti preprocessing data yang meliputi proses cleaning, case folding, dan stopword removal kemudian dilanjutkan dengan proses identifikasi slang pada kalimat dan terakhir dilakukan proses normalisasi slang yang didapatkan. Penelitian ini menemukan bahwa metode fasttext masih belum cukup baik melakukan normalisasi slang dikarenakan masih ada sekitar 1329 data dari 3239 data yang tidak berhasil dinormalisasi dengan baik yaitu sekitar 41%. Penelitian ini memberikan kontribusi dalam membantu proses pengolahan kata yang lebih baik untuk NLP.

Copyrights © 2024






Journal Info

Abbrev

JPTK

Publisher

Subject

Other

Description

Jurnal Pendidikan Teknologi dan Kejuruan (JPTK) is a journal managed by the Faculty of Engineering and Vocational, Universitas Pendidikan Ganesha (Undiksha). The scope of this journal covers the fields of Education, Electrical Engineering, Informatics, Computer Science, Information System, ...