Jurnal Teknologi Informasi, Komputer, dan Aplikasinya (JTIKA )
Vol 4 No 2 (2022): September 2022

FREQUENT ITEMSET MINING PADA ARTIKEL COVID-19 MENGGUNAKAN WEB CRAWLING DAN ALGORITMA FP-GROWTH

Rizky Dwi Hadisaputro (PSTI FT UNRAM)
I Gede Putu Wirarama Wadashwara Wirawan (Universitas Mataram)
Ariyan Zubaidi (Universitas Mataram)



Article Info

Publish Date
29 Sep 2022

Abstract

Virus Corona COVID-19 merupakan penyakit yang telah menjadi pandemi di seluruh Dunia. Khususnya Indonesia yang berada di posisi 20 besar negara yang menyumbang kasus terbanyak COVID-19. Hal ini menyebabkan banyaknya pemberitaan tentang virus ini oleh berbagai media massa. Salah satu cara penyampaian informasi yang cukup populer adalah melalui portal berita daring. Dalam mengekstraksi kata yang mengandung dampak serta bahasan virus corona dapat menggunakan teknik data mining. Data mining akan memudahkan dalam mengekstraksi informasi yang bermanfaat dan pengetahuan terkait dari berbagai basis data besar. Dalam mendapatkan basis data berita yang besar pada penelitian ini digunakan teknik web. Hasil crawling selanjutnya akan diolah dan dicari kombinasi kata yang sering muncul atau dikenal dengan istilah frequent itemset. Teknik Frequent Patten Growth (FP-Growth) adalah salah satu algoritma dalam mencari frequent itemset yang merupakan pengembangan dari algoritma Apriori. Data yang digunakan sebanyak 7857 berita dari 10 kategori berita dengan kata kunci pencarian “Corona Indonesia”. Nilai ambang batas yang digunakan untuk studi kasus ini berada pada nilai 0,8 untuk support dan 0,7 untuk confidence yang menghasilkan frequent itemset sebanyak 246869. Dalam penelitian ini strong rule association yang dihasilkan adalah kombinasi kata (Baca, Indonesia) dengan kata (Corona, Orang, Covid) yang memiliki nilai confidence 1,0, adapun untuk nilai rule terendah berada pada kombinasi kata (Baca, Indonesia, Video) dengan kata (Gambas, Laku, Corona, Sebar, Orang, Covid, Detik) dengan nilai confidence yang dihasilkan 0,8.

Copyrights © 2022






Journal Info

Abbrev

JTIKA

Publisher

Subject

Computer Science & IT Decision Sciences, Operations Research & Management Engineering

Description

Jurnal Teknologi Informasi, Komputer dan Aplikasinya disingkat dengan JTIKA diterbitkan oleh Program Studi Teknik Informatika Fakultas Teknik Universitas Mataram sebagai wadah publikasi hasil penelitian original dalam di bidang teknologi informasi, ilmu komputer dan aplikasinya. JTIKA adalah open ...