Claim Missing Document
Check
Articles

Found 3 Documents
Search

Analisis Sentimen pada Twitter menggunakan Word Embedding dengan Pendekatan Word2Vec Hastari Utama; Ahlihi Masruro
Jurnal Sistem Cerdas Vol. 5 No. 2 (2022)
Publisher : APIC

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.37396/jsc.v5i2.242

Abstract

In this day and age, the use of social media is familiar to some circles. The existence of social media can be analyzed for certain interests. This analysis can also be carried out for the benefit of knowing the opinions or sentiments that contain it. Therefore, a sentiment analysis is needed to get a classification of existing opinions. The use of sentiment analysis cannot be separated from the document or text representation stage. This usually takes the form of the bag of word (BOW). However, BOW has a weakness, namely it produces a lot of features so that the classification accuracy results are less than optimal. Therefore we need the Word Embedding method to represent documents in vector form. The use of this method results in fewer features so that data training time can be shorter. Apart from that, the syntax and semantics of the words that compose the tweet are also considered. So, Word Embedding produces meaningful vectors.
Weak Supervision Dengan Pendekatan Labeling Function Untuk Analisis Sentimen Pada Twitter Hastari Utama; Erna Daniati; Ahlihi Masruro
The Indonesian Journal of Computer Science Research Vol. 3 No. 1 (2024): Januari
Publisher : Hemispheres Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.59095/ijcsr.v3i1.93

Abstract

Penggunaan sosial media saat ini telah meningkat dengan pesat. Salah satu jenis media sosial yang digunakan adalah Twitter. Media sosial ini memiliki miliaran pengguna dari seluruh dunia. Jadi, dalam waktu yang singkat data tweet yang mereka posting telah ada pada penyimpaannya. Setiap pengguna juga dibatasi jumlah karakter dalam melakukan pengiriman tweetnya. Namun, kumpulan tweet pada media sosial ini memiliki konteks tema yang bervariatif. Hal ini dapat memuat sentimen emosional seperti senang, sedih, gembira, duka, dan sebagainya. Berbagai jenis data tweet yang disediakan ini sangat berpotensial untuk dianalisis terutama bagi perusahaan berbasis profit. Hal ini dapat memuat kebiasaan pelanggan, tren produk, indeks saham, dan sebagainya. Salah satu jenis analisis yang dilakukan adalah sentiment analisis. Hal ini berguna untuk mengklasifikasikan opini tweet yang ada. Opini ini dapat berupa positif, negatif, atau netral. Hasil analisis ini sangat diperlukan perusahaan untuk mengetahui tren yang terjadi pada era ini. Salah satu solusi yang ditawarkan pada penelitian ini adalah dengan menggunakan Weak Supervision. Namun, ada tantangan yang terjadi pada metode ini. Hal ini adalah kuranganya tingkat akurasi jika dibandingkan dengan pelabelan secara manual.  Pada penelitian ini dilakukan pelabelan otomatis dengan weak supervision. Selain itu, dilakukan pendekatan labeling function dan Regex Pattern dalam melakukan pelabelan secara otomatis. Hal ini diharapakan dataset yang dilabeli akan menghasilkan model dengan tingkat akurasi mendekat pelabelan secara manual, lebih lagi jika dapat mengungguli metode manual. Selain itu, kontribusi yang diharapkan dalam penelitian ini adalah usaha untuk mempersingkat waktu pelabelan daripada dilakukan secara manual.Ringkasan penelitian tidak lebih dari 500 kata yang berisi latar belakang penelitian, tujuan dan metode penelitian yang diusulkan, luaran yang ditargetkan, serta uraian kontribusi penelitian. Gunakan style Abstract pada bagian ini dengan satu paragraf.
Integrasi Augmentasi Data dan Machine Learning dalam Prediksi Magnitudo Gempa Bumi: Analisis dengan Random Forest Regressor dan Visualisasi Geospasial Hastari Utama; Ahlihi Masruro; Toto Indriyatmoko; Sudarmanto Sudarmanto
BHATARA: Jurnal Multidisiplin Ilmu Vol 2 No 3 (2025): October
Publisher : Hemispheres Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.59095/jmb.v2i3.233

Abstract

This research aims to enhance the accuracy of earthquake magnitude prediction through an integration of data augmentation techniques and machine learning based on the Random Forest Regressor, supported by geospatial visualization for in-depth analysis. The dataset used originates from the USGS (United States Geological Survey) in CSV format, encompassing over a thousand global earthquake events within one month, with seismic parameters such as location (latitude, longitude), depth, magnitude, and recording quality. In the context of imbalanced data—dominated by small earthquakes and rare large ones—a data augmentation technique based on noise injection into spatial features (latitude, longitude) and depth was applied, resulting in a dataset five times larger than the original. Evaluation results demonstrate significant improvement in model performance: MAE decreased from 0.2467 to 0.1046 (a 57.6% reduction), RMSE dropped from 0.3499 to 0.1868 (a 46.6% decrease), MSE reduced from 0.1225 to 0.0349 (a 71.5% reduction), and R² increased from 0.9493 to 0.9817. These improvements confirm that data augmentation not only reduces overfitting but also strengthens the model’s ability to predict large-magnitude earthquakes—classes most critical for disaster mitigation. Geospatial visualization displays the spatiotemporal distribution of earthquakes, identifying active seismic hotspots in regions such as the Pacific Ring of Fire, California, Alaska, and Indonesia. This research proves that data augmentation is not merely a supplementary technique but a crucial strategy to enhance model generalization and predictive performance, particularly for rare yet high-impact seismic events. The findings offer significant scientific and practical contributions to seismic hazard mitigation and risk mapping, with potential applications in early warning systems and real-time disaster response.