Claim Missing Document
Check
Articles

Found 1 Documents
Search
Journal : IJCCS (Indonesian Journal of Computing and Cybernetics Systems)

Ekstraksi Informasi Halaman Web Menggunakan Pendekatan Bootstrapping pada Ontology-Based Information Extraction Erma Susanti; Khabib Mustofa
IJCCS (Indonesian Journal of Computing and Cybernetics Systems) Vol 9, No 2 (2015): July
Publisher : IndoCEISS in colaboration with Universitas Gadjah Mada, Indonesia.

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.22146/ijccs.7540

Abstract

AbstrakEkstraksi  informasi  merupakan suatu bidang ilmu untuk pengolahan bahasa alami, dengan cara mengubah teks tidak terstruktur menjadi informasi dalam bentuk terstruktur. Berbagai jenis informasi di Internet ditransmisikan secara tidak terstruktur melalui website, menyebabkan munculnya kebutuhan akan suatu teknologi untuk menganalisa teks dan menemukan pengetahuan yang relevan dalam bentuk informasi terstruktur. Contoh informasi tidak terstruktur adalah informasi utama yang ada pada konten halaman web. Bermacam pendekatan untuk ekstraksi informasi telah dikembangkan oleh berbagai peneliti, baik menggunakan metode manual atau otomatis, namun masih perlu ditingkatkan kinerjanya terkait akurasi dan kecepatan ekstraksi. Pada penelitian ini diusulkan suatu penerapan pendekatan ekstraksi informasi dengan mengkombinasikan pendekatan bootstrapping dengan Ontology-based Information Extraction (OBIE). Pendekatan bootstrapping dengan menggunakan sedikit contoh data berlabel, digunakan untuk memimalkan keterlibatan manusia dalam proses ekstraksi informasi, sedangkan penggunakan panduan ontologi untuk mengekstraksi classes (kelas), properties dan instance digunakan untuk menyediakan konten semantik untuk web semantik. Pengkombinasian kedua pendekatan tersebut diharapkan dapat meningkatan kecepatan proses ekstraksi dan akurasi hasil ekstraksi. Studi kasus untuk penerapan sistem ekstraksi informasi menggunakan dataset “LonelyPlanet”. Kata kunci—Ekstraksi informasi, ontologi, bootstrapping, Ontology-Based Information Extraction, OBIE, kinerja Abstract Information extraction is a field study of natural language processing by converting unstructured text into structured information. Several types of information on the Internet is transmitted through unstructured information via websites, led to emergence of the need a technology to analyze text and found relevant knowledge into structured information. For example of unstructured information is existing main information on the content of web pages. Various approaches  for information extraction have been developed by many researchers, either using manual or automatic method, but still need to be improved performance related accuracy and speed of extraction. This research proposed an approach of information extraction that combines bootstrapping approach with Ontology-Based Information Extraction (OBIE). Bootstrapping approach using small seed of labelled data, is used to minimize human intervention on information extraction process, while the use of guide ontology for extracting classes, properties and instances, using for provide semantic content for semantic web. Combining both approaches expected to increase speed of extraction process and accuracy of extraction results. Case study to apply information extraction system using “LonelyPlanet” datasets. Keywords— Information extraction, ontology, bootstrapping, Ontology-Based Information Extraction, OBIE, performance
Co-Authors -, Suraya ., Kumalasanti Afifah Dzuriatun Khasanah Agus Aan Jiwa Permana Agusalim Syamsudin Pure Almuntaha, Eska Amir Hamzah Amir Hamzah Ardhin Primadewi Ariyana, Renna Yanwastika Armizi, Armizi Arum, Rosalia Brilly Lutfan Qasthari Dahlia, Reski Dina Liana Dini Pujiatin Dino Rahman Sya'bani Edhy Sutanta (Jurusan Teknik Informatika IST AKPRIND Yogyakarta) Eko Nur Cahyo Eko Nur Cahyo Endang Efendi Erfanti Fatkhiyah Erna Kumalasari Erna Kumalasari Nurnawati Erna Kumalasari Nurnawati Fadhila Tangguh Admojo Fitrianingsih, Ari Gustian Rohendi Hae Isnapoh Maykel Yoseph Hanafi Eko Kurniawan Hen i Putriningtyas Huzain Azis Ika Arfiani Ikramullah, Ahmad Saleh Kafrawi Kafrawi Khabib Mustofa Khasanah, Rahayu Kumalasanti . Kurniawan, Hanafi Eko Luay Nabila El Suffa Lucio Almeida Da Costa Maimunah, Maimunah Muhammad Ardi Setiawan Muhammad Rizqy Ath-Thaariq Muhammad Rizqy Ath-Thaariq MUHAMMAD SHOLEH Muhammad Sholeh Muhammadiyah, Muhammadiyah Muntaha Nega Napratilora, Martina Nurmala Eka Safitri Nuryati, Istin Oktavia, Yunika Putri Pradnyana, I Wayan Julianta Prita Haryani Pujiatin, Dini Purnomo, Tuessi Ari Rafi, Naufal Fajar Renna Yanwastika Ariyana5 Ria Mega Lestari Riki Apriadi Riki Apriadi Ririn Septrisulviani Rosalia Arum Rosalia Arum Kumalasanti RR. Yuliana Rachmawati Rr. Yuliana Rachmawati Rr. Yuliana Rachmawati Sambuari , Meychel Danius Fedrix Sani, Faozan Asrul Saniyah, Saniyah Satrio Muslim Wibowo Septian Efendi Septrisulviani, Ririn Setiawan, Akhmad Fajar Setiya Nugroho Sholeh, Muhammad Siami, M. Ikbal Siti Saudah Sunia Raharja, I Made Suraya - Suwanto Raharjo Tarigan, Thomas Edyson Taufiqur Rohman Ticker Th, Elfrid Uning Lestari Wibowo, Satrio Muslim Windyaning Ustyannie Wulansari, Nidia