Claim Missing Document
Check
Articles

Found 3 Documents
Search
Journal : Jurnal Buana Informatika

Pembentukan Dataset Token Sentimen Berdasarkan Akun Instagram Brand Elektronik Menggunakan K-Nearest Neighbors Nugraha, Kristian Adi
Jurnal Buana Informatika Vol 12, No 1 (2021): Jurnal Buana Informatika Volume 12 - Nomor 1 - April 2021
Publisher : Universitas Atma Jaya Yogyakarta

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.24002/jbi.v12i1.4472

Abstract

Abstract. Generating Sentiment Token Dataset Based on Electronics Brand Instagram Account using K-Nearest Neighbors. Instagram is currently one of the most popular social media platforms for businesses and brand owners to promote their products. Because Instagram is a two-way communication platform, people can respond to any promotional content posted on Instagram. People's reactions come in a variety of form, and frequently include both positive and negative sentiment. This study aims to identify the words used in one type of sentiment, then use the K-NN approach to construct a token dataset by summarizing the phrases in many labels according to the sentiment type. The total accuracy value of the dataset for K = 1 is 33.38% (positive), 59.96% (negative), and 56.60% (neutral) based on the results of the tests performed.Keywords: sentiment analysis, K-Nearest Neighbors, dataset, InstagramAbstrak. Instagram saat ini menjadi salah satu media sosial yang banyak digunakan oleh perusahaan atau pemilik brand untuk melakukan promosi terhadap produk-produk yang dimilikinya. Karena bersifat dua arah, masyarakat dapat memberikan respon terhadap aktivitas promosi yang dilakukan oleh sebuah perusahaan melalui Instagram. Respon dari masyarakat memiliki varian yang beragam dan seringkali mengandung unsur sentimen baik positif maupun negatif. Penelitian ini mencoba untuk mengidentifikasi kata-kata yang digunakan dalam satu jenis sentimen, kemudian membuat dataset token dengan cara merangkum kata-kata tersebut dalam beberapa label sesuai jenis sentimen masing-masing menggunakan metode K-NN. Berdasarkan hasil pengujian yang dilakukan, didapatkan nilai akurasi dari dataset sebesar 33.38% (positif), 59.96% (negatif), dan 56.60% (netral) untuk K = 1.Kata Kunci: analisis sentimen, K-Nearest Neighbors, dataset, Instagram
Penerapan Optical Character Recognition untuk Pengenalan Variasi Teks pada Media Presentasi Pembelajaran Nugraha, Kristian Adi
Jurnal Buana Informatika Vol. 15 No. 01 (2024): Jurnal Buana Informatika, Volume 15, Nomor 01, April 2024
Publisher : Universitas Atma Jaya Yogyakarta

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Media digital merupakan bentuk utama media pembelajaran yang banyak digunakan untuk kegiatan belajar mengajar di kelas saat ini. Media pembelajaran digital umumnya tersimpan dalam bentuk citra karena memiliki unsur visual di dalamnya. Salah satu kelemahan data dalam bentuk citra adalah seluruh isi di dalamnya dianggap sebagai gambar, sementara pada media pembelajaran juga terdapat unsur teks di dalamnya. Oleh karena itu, dibutuhkan metode OCR untuk membaca teks di dalamnya agar media tersebut dapat diolah lebih lanjut, misalnya untuk keperluan kategorisasi (indexing) atau untuk dibaca pada sistem lain seperti chatbot. Umumnya, metode OCR digunakan untuk mengenali tulisan dengan bentuk yang seragam pada sebuah citra. Sedangkan pada media pembelajaran, teks di dalamnya memiliki variasi yang berbeda-beda. Penelitian ini mencoba menerapkan metode OCR dengan menggunakan Tesseract untuk menguji 30 data media pembelajaran yang memiliki berbagai macam variasi teks dalam sebuah citra. Hasil pengujian menunjukkan tingkat akurasi pengenalan teks yang cukup baik, yaitu sebesar 91,11%.
Penerapan Optical Character Recognition untuk Pengenalan Variasi Teks pada Media Presentasi Pembelajaran Nugraha, Kristian Adi
Jurnal Buana Informatika Vol. 15 No. 01 (2024): Jurnal Buana Informatika, Volume 15, Nomor 01, April 2024
Publisher : Universitas Atma Jaya Yogyakarta

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Media digital merupakan bentuk utama media pembelajaran yang banyak digunakan untuk kegiatan belajar mengajar di kelas saat ini. Media pembelajaran digital umumnya tersimpan dalam bentuk citra karena memiliki unsur visual di dalamnya. Salah satu kelemahan data dalam bentuk citra adalah seluruh isi di dalamnya dianggap sebagai gambar, sementara pada media pembelajaran juga terdapat unsur teks di dalamnya. Oleh karena itu, dibutuhkan metode OCR untuk membaca teks di dalamnya agar media tersebut dapat diolah lebih lanjut, misalnya untuk keperluan kategorisasi (indexing) atau untuk dibaca pada sistem lain seperti chatbot. Umumnya, metode OCR digunakan untuk mengenali tulisan dengan bentuk yang seragam pada sebuah citra. Sedangkan pada media pembelajaran, teks di dalamnya memiliki variasi yang berbeda-beda. Penelitian ini mencoba menerapkan metode OCR dengan menggunakan Tesseract untuk menguji 30 data media pembelajaran yang memiliki berbagai macam variasi teks dalam sebuah citra. Hasil pengujian menunjukkan tingkat akurasi pengenalan teks yang cukup baik, yaitu sebesar 91,11%.