Journal of Information System,Graphics, Hospitality and Technology
Vol. 1 No. 02 (2019): Journal of Information System,Graphics, Hospitality and Technology

Ekstraksi Teks Pada Halaman Website Renungan Rohani Menggunakan HTML Agility Pack

James Wijaya (Universitas Ciputra Surabaya)



Article Info

Publish Date
31 Oct 2019

Abstract

Dengan adanya perkembangan teknologi informasi, orang-orang dapat mengakses berbagai informasi dari berbagai halaman web dengan menggunakan internet. Web Santapan Rohani adalah salah satu contoh website yang dapat digunakan oleh orang-orang terlebih khusus umat Kristiani untuk membaca renungan harian atau untuk melakukan saat teduh. Penelitian ini bertujuan menciptakan suatu teknologi ekstraksi informasi dari web Santapan Rohani yang berisikan renungan harian sehingga dapat membantu untuk analisa bagi penelitian-penelitian berikutnya yang dapat dikembangkan dari kehadiran teknologi ini. Halaman web memiliki bentuk yang semi-structured dan berisikan informasi berupa teks, gambar, video, URL, dan sebagainya. Hal ini menjadi kendala untuk dapat melakukan ekstraksi informasi dari halaman web. HTML Agility Pack merupakan salah satu tools terbaik yang dapat digunakan untuk melakukan HTML Parser dari suatu halaman web. Dengan menggunakan HTML Agility Pack dapat mempermudah untuk melakukan ekstraksi informasi dari berbagai halaman web, terlebih khusus untuk melakukan ekstraksi informasi pada renungan harian dari Web Santapan Rohani.

Copyrights © 2019






Journal Info

Abbrev

insight

Publisher

Subject

Computer Science & IT Control & Systems Engineering Education Engineering Other

Description

Journal of Information System, Graphics, Hospitality and Technology (INSIGHT) aims to provide scientific literatures on studies of pure and applied research in information systems (IS)/information technology (IT) and public review of the development of theory, method and applied sciences related to ...