Data Sciences Indonesia (DSI)
Vol. 5 No. 1 (2025): Article Research Volume 5 Issue 1, June 2025

Web Scraping Data Ulasan Pelanggan untuk Kemajuan Bisnis E-Commerce pada Official Store dan Non-Official Store dengan Pendekatan Natural Language Processing

Al Hafizh, Muhamad Rafif (Unknown)
Aldi Daim Fauzan (Unknown)
Woro Isti Rayahu (Unknown)
Kiki Mustaqim (Unknown)
Rahma Hanum (Unknown)



Article Info

Publish Date
01 Jul 2025

Abstract

Penelitian ini bertujuan mengaplikasikan teknik Web Scraping untuk mendapatkan data ulasan official store dan non-official store dari Tokopedia untuk dibandingkan dan dilakukan Sentiment Analysis untuk menghapus prasangka bahwa official store lebih unggul daripada non-official store. Web Scraping adalah teknik ekstraksi data secara otomatis dari web melalui HTML yang kemudian di-framing menjadi dataframe agar mudah dibaca. Data yang sudah diubah akan melalui Preprocessing Data, yang mencakup Data Cleaning, Normalisasi, Stopword Removal, Tokenize, Stemming, dan Translate. Proses ini menghasilkan kata yang siap diolah ke Labelling, dan diberi sentimen positif, negatif, dan netral. Hasil perbandingannya adalah Faith Industries mendapatkan 80.9% positif, 4.4% negatif, dan 14.6% netral, sedangkan Julclothing mendapatkan 69.1% positif, 18.0% negatif, dan 13.0% netral. Perbandingan tersebut tidak signifikan, dapat disimpulkan bahwa non-official store dapat bersaing dengan official store. Perbandingan selanjutnya terdapat di frekuensi sentimen terbanyak. Kedua toko tersebut memiliki kata ‘fit’ sebagai sentimen positif dan ‘measure’ sebagai sentimen netral, sedangkan sentimen negatif Faith Industries mendapatkan kata ‘long’, Julclothing mendapatkan kata ‘small’. Klasifikasi negatif tersebut disimpulkan bahwa permasalahan utama pelanggan tidak puas karena ukuran baju. Solusi permasalahan utama bagi toko dan pelanggan, yaitu toko menyediakan chart size yang sesuai dan pelanggan mengukur baju sesuai chart size sebelum membeli produk dari toko tersebut

Copyrights © 2025






Journal Info

Abbrev

dsi

Publisher

Subject

Computer Science & IT Education Physics

Description

Data Sciences Indonesia (DSI) adalah jurnal yang memuat hasil penelitian atau kajian ilmu di bidang Ilmu komputer dengan mengambil ranah Data Sciende dan pendukung keilmuan tersebut. Data Sciences Indonesia (DSI) terbit setiap dua kali dalam setahun, yaitu pada bulan Juni dan Desember. Data Sciences ...