Hidayati, Nuraisa Novia
Unknown Affiliation

Published : 2 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 2 Documents
Search

Otomatisasi Pendeteksi Kata Baku Dan Tidak Baku Pada Data Twitter Berbasis KBBI Raif, M. Irfan; Hidayati, Nuraisa Novia; Matulatan, Tekad
Jurnal Teknologi Informasi dan Ilmu Komputer Vol 11 No 2: April 2024
Publisher : Fakultas Ilmu Komputer, Universitas Brawijaya

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.25126/jtiik.20241127404

Abstract

Penelitian ini mengembangkan sistem deteksi otomatis kata-kata baku dan non-baku pada data Twitter berbasis Kamus Besar Bahasa Indonesia (KBBI). Twitter merupakan platform media sosial yang populer, namun sering kali digunakan dengan kata-kata tidak baku yang mengganggu komunikasi. Normalisasi kata-kata tidak baku diperlukan untuk pemrosesan dan analisis tweet. Penelitian sebelumnya menggunakan metode Levenshtein Distance dan pengklasifikasi Naïve Bayes, serta Term Based Random Sampling dalam proses Stopword Removal. Preprocessing penting dalam klasifikasi teks di media sosial. Penelitian ini fokus pada preprocessing dan deteksi kata-kata baku dan non-baku pada data Twitter menggunakan KBBI. Sistem otomatis ini membantu peneliti mencari kata-kata non-baku atau slang dengan mudah, meningkatkan kualitas komunikasi, dan pemahaman pesan di data Twitter yang mencerminkan tren bahasa yang berkembang. Penelitian ini juga memperkenalkan pendekatan yang terstruktur untuk mengotomatisasi deteksi kata-kata baku dan non-baku, dengan langkah-langkah yang meliputi pengumpulan data, preprocessing data, identifikasi bahasa tidak baku, penghapusan kata berimbuhan, dan identifikasi kata slang. Metode ini mendukung analisis sentimen dalam text mining dan memastikan hasil klasifikasi sentimen yang lebih akurat dalam data Twitter. Berdasarkan pengujian, langkah-langkah preprocessing meningkatkan performa metode penentuan polarity dengan accuracy InSet sebesar 66,66% dan F1-score sebesar 61,40%.
Improving Aspect-Based Sentiment Analysis for Hotel Reviews with Latent Dirichlet Allocation and Machine Learning Algorithms Hidayati, Nuraisa Novia
Register: Jurnal Ilmiah Teknologi Sistem Informasi Vol 9 No 2 (2023): July
Publisher : Information Systems - Universitas Pesantren Tinggi Darul Ulum

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26594/register.v9i2.3441

Abstract

The rapid expansion of online platforms has resulted in a deluge of user-generated content, emphasizing the need for sentiment analysis to gauge public opinion. Aspect-based sentiment analysis is now essential for uncovering intricate opinions within product reviews, social media posts, and online texts. Despite their potential, the complexity of human emotions and diverse language nuances pose significant challenges. Our study focuses on the importance and trends of sentiment and aspect-based sentiment analysis in automated review analysis, with a primary focus on Indonesian-language hotel reviews. Our research underscores the need for nuanced tools to unravel multifaceted sentiments. We propose an automation framework that utilizes Latent Dirichlet Allocation (LDA) for feature extraction. We evaluate LDA's performance, enhance it through filtration, and enrich it by integrating it with Word2Vec and Doc2Vec. Our methodology encompasses various machine learning algorithms, including Logistic Regression (LR), Stochastic Gradient Descent (SGD), Support Vector Machine (SVM), Random Forest (RF), and Light Gradient Boosting Machine (LGBM). Empirical results reveal that the optimal combination involves LDA bigram and Word2Vec, alongside the LGBM classifier, yielding an average F1 score of 86.6 across ten aspects. This contribution advances automated aspect-based sentiment analysis, offering concrete implications for e-commerce, marketing, and customer service. Our insights inform precise marketing strategies and enhance customer experiences, underscoring the research's relevance in the digital landscape.