Jurnal Buana Informatika
Vol 12, No 1 (2021): Jurnal Buana Informatika Volume 12 - Nomor 1 - April 2021

Ekstraksi Informasi Terstruktur Profil Pengguna Website Iklan Baris

Cahyono, Nuri (Unknown)



Article Info

Publish Date
11 May 2021

Abstract

Abstract. Extraction of Structured Information on Classified Ads Website User Profiles. The large amount of user data published on online buying and selling sites provides benefits for research and digital marketing. Data extraction was a method for obtaining data from publicly published website content. The first step was to determine the website category that was needed, then determined the attributes to be used as a reference in compiling the data extraction tags. The next step was to identify the tags that were taken based on the tag elements of the website that matched these attributes. Elements to compile tag extraction included CSS Selector, HTML Tag and Xpath. Based on this, a data extraction code was created with four iterations based on categories. The test was done by calculating the accuracy to find out the complete amount of extracted data. From a total of 16,000 data extracted in this test, the accuracy rate was 99.0625%.Keywords: Data Extraction, Web Scrapping, Classified Ads Abstrak. Perkembangan situs jual beli online berdampak pada banyaknya data pengguna yang dipublikasikan secara online. Profil pengguna situs web memiliki banyak manfaat baik untuk penelitian maupun untuk tujuan dalam pemasaran digital. Ekstraksi data adalah mekanisme untuk mendapatkan data dari konten situs web yang disajikan secara umum. Langkah pertama adalah menentukan kategori website kemudian menentukan atribut yang akan digunakan sebagai acuan dalam menyusun tag ekstraksi data yang diambil berdasarkan elemen tag dari website yang sesuai dengan atribut tersebut. Elemen tag yang diambil untuk menyusun tag ekstraksi antara lain CSS Selector, HTML Tag dan Xpath, kemudian dibuat skenario ekstraksi data dengan skenario empat kasus berdasarkan kategori yang telah ditentukan. Pengujian dilakukan dengan menghitung akurasi untuk mengetahui jumlah data yang berhasil di dapatkan secara lengkap. Dari total 16000 data dari hasil ekstraksi, dalam pengujian ini menghasilkan tingkat akurasi 99.0625%.Kata Kunci: Ekstraksi Data, Web Scrapping, Iklan Baris

Copyrights © 2021