I Nyoman Saputra Wahyu Wijaya
Unknown Affiliation

Published : 3 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 3 Documents
Search

IDENTIFIKASI DAN NORMALISASI TEKS SLANG DENGAN FASTTEXT PADA TWITTER DALAM BAHASA INDONESIA pande sindu; Agus Aan Jiwa Permana; I Nyoman Saputra Wahyu Wijaya
Jurnal Pendidikan Teknologi dan Kejuruan Vol. 21 No. 1 (2024): Edisi Januari 2024
Publisher : Universitas Pendidikan Ganesha

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.23887/jptkundiksha.v21i1.66381

Abstract

Salah satu dampak yang signifikan dari popularitas media sosial adalah munculnya istilah slang yang semakin banyak. Istilah slang adalah bahasa yang digunakan oleh kelompok-kelompok tertentu untuk berkomunikasi secara informal. Slang juga dapat muncul melalui singkatan, penggunaan kata-kata yang berbeda dari arti aslinya, atau penggabungan kata-kata yang tidak konvensional. Dalam pengolahan bahasa alami (Natural Language Processing) Slang sering kali memiliki makna yang tidak jelas atau ambigu, dan kata-kata slang dapat memiliki konotasi yang berbeda tergantung pada konteks dan subkultur tertentu. Ini dapat menyebabkan kesalahan dalam pemrosesan bahasa alami dan menghasilkan hasil yang tidak akurat atau salah dalam tugas seperti klasifikasi teks atau analisis sentimen. Dari permasalahan tersebut dalam penelitian ini dikembangkan suatu metode untuk mengidentifikasi dan melakukan normalisasi slang pada kalimat yang akan diproses oleh NLP. Proses normalisasi slang ke bahasa yang lebih standar dilakukan dengan memanfaatkan pretrain model dari fasttext untuk mencari kata – kata yang memiliki kedekatan dengan slang. Data yang digunakan pada penelitian ini didapatkan dari sosial media twitter. Sebelum dinormalisasi data melewati beberapa proses seperti preprocessing data yang meliputi proses cleaning, case folding, dan stopword removal kemudian dilanjutkan dengan proses identifikasi slang pada kalimat dan terakhir dilakukan proses normalisasi slang yang didapatkan. Penelitian ini menemukan bahwa metode fasttext masih belum cukup baik melakukan normalisasi slang dikarenakan masih ada sekitar 1329 data dari 3239 data yang tidak berhasil dinormalisasi dengan baik yaitu sekitar 41%. Penelitian ini memberikan kontribusi dalam membantu proses pengolahan kata yang lebih baik untuk NLP.
DEVELOPMENT OF THE PROPOSED MICROLEARNING-BASED DYNAMIC INTELLECTUAL LEARNING SYSTEM TO ACTUALIZE AN EFFECTIVE LEARNING PROCESS IN ONLINE ENVIRONMENT Marti, Ni Wayan; I Gusti Putu Suharta; Ketut Agustini; I Komang Sudarma; I Nyoman Saputra Wahyu Wijaya; Luh Putu Tuti Ariani
Jurnal Pendidikan Teknologi dan Kejuruan Vol. 21 No. 1 (2024): Edisi Januari 2024
Publisher : Universitas Pendidikan Ganesha

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.23887/jptkundiksha.v21i1.75672

Abstract

The era of educational transformation in the 21st century is a stream of change where teachers and students simultaneously hold an important role in the learning process. In this matter, it is necessary to apply innovation and technology integration to realize an effective learning process. This study aims to build a dynamic intellectual learning system based on microlearning (DIL-MicLearn system) which is accessed via the web. This research uses a theoretical-descriptive-development method that uses theoretical studies, software development proses, and expert evaluation. The research phase used is the first two stages of the Plomp design research model, namely the Prelimentary Research stage, and the Development or Prototyping phase. The DIL-MicLearn system is a personalized learning system that allows students to achieve learning mastery in each learning unit according to their cognitive abilities and learning speed, can access learning content according to learning styles, and can reduce students' cognitive load in the learning process. The DIL-MicLearn system is implemented in a online learning environment, considering the characteristics of this system. The advantages and disadvantages of this system are described in detail. The validity level of the DIL-MicLearn system reaches 99.57% and this system is valid for use in the learning process.
MODEL KLASIFIKASI TWEET TERKAIT ISU #INDONESIAGELAP MENGGUNAKAN SUPPORT VECTOR MACHINE BERBASIS DISTRIBUSI TOPIK LDA Fransesko Indrajid; I Nyoman Saputra Wahyu Wijaya
Jurnal Informatika dan Teknik Elektro Terapan Vol. 14 No. 1 (2026)
Publisher : Universitas Lampung

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.23960/jitet.v14i1.8878

Abstract

Abstrak. Tagar #IndonesiaGelap di platform X mencerminkan keresahan masyarakat terhadap dinamika sosial-politik Indonesia. Tingginya volume data tweet terkait tagar ini menghadirkan tantangan praktis dalam pengembangan model klasifikasi teks. Kendala utama terletak pada proses pelabelan data untuk supervised learning, di mana pelabelan manual pada dataset berskala besar menjadi tidak efisien dan memakan waktu lama. Penelitian ini bertujuan untuk mengembangkan model klasifikasi teks sekaligus menyelesaikan permasalahan efisiensi pelabelan tersebut melalui pendekatan otomatis. Metode yang diusulkan mengintegrasikan Latent Dirichlet Allocation (LDA) sebagai generator label otomatis (automated labeling) dan Support Vector Machine (SVM) sebagai pengklasifikasi. LDA digunakan untuk mengekstraksi struktur topik tersembunyi yang kemudian dikonversi menjadi label kategori untuk data latih. Hasil eksperimen menunjukkan bahwa LDA berhasil membentuk 6 label topik yang koheren. Model SVM yang dilatih menggunakan data berlabel otomatis ini, melalui optimasi hyperparameter Kernel RBF, mampu mencapai akurasi sebesar 88,05%. Penelitian ini membuktikan bahwa integrasi LDA dan SVM merupakan solusi strategis untuk mengatasi hambatan pelabelan data, memungkinkan pembangunan model klasifikasi yang akurat pada data media sosial berskala besar tanpa memerlukan intervensi manual. Abstract. The #IndonesiaGelap hashtag on the X platform reflects public unrest regarding Indonesia's socio-political dynamics. The high volume of tweets regarding this hastag presents practical challenges in developing text classification models. The primary obstacle lies in the data labeling process for supervised learning, where manual labeling on large-scale datasets is inefficient and time-consuming. This study aims to develop a text classification model while solving the labeling efficiency problem through an automated approach. The proposed method integrates Latent Dirichlet Allocation (LDA) as an automated label generator and Support Vector Machine (SVM) as a classifier. LDA is utilized to extract hidden topic structures, which are then converted into category labels for training data. Experimental results show that LDA successfully formed 6 coherent topic labels. The SVM model trained using this automatically labeled data, through RBF Kernel hyperparameter optimization, achieved an accuracy of 88.05%. This study demonstrates that the integration of LDA and SVM is a strategic solution to overcome data labeling bottlenecks, enabling the construction of accurate classification models on massive social media data without the need for manual intervention.