Claim Missing Document
Check
Articles

Found 12 Documents
Search

Aplikasi untuk Membangun Corpus dari Data Hasil Crawling dengan Berbagai Format Data Secara Otomatis Jati Sasongko
Dinamik Vol 15 No 1 (2010)
Publisher : Universitas Stikubank

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.35315/dinamik.v15i1.107

Abstract

Aplikasi membangun corpus dengan berbagai format data dibangun dari beberapa proses atau modulsehingga membentuk aplikasi yang befungsi untuk membangun sebuah corpus. Proses-proses yang terdapatpada aplikasi membangun corpus terdiri dari : pengumpulan data file teks dan image (crawling), posespencarian file teks dan image dalam folder atau direktori (searching), proses input data file teks dan image kedatabase (corpus), proses pengindeksan (indexing).Aplikasi mampu menampilkan hasil pencarian dokumen dan mengurutkannya berdasarkan urutan daripenemuan dari file data yang dicari, dalam arti dokumen data yang ditemukan pertama kali akan ditempatkandiurutan pertama sedangkan dokumen data yang ditemukan terakhir akan ditempatkan pada urutan palingbawah. Aplikasi juga mampu melakukan konversi dari dokumen teks dengan berbagai format data ke dalambentuk dokumen teks txt, juga dalam melakukan konversi pada semua format file image ke dalam bentukformat bmp. Konversi dilakukan untuk menyamakan format untuk dapat mempermudah dalam penyimpanandalam database.
Pencarian Dokumen Teks Lintas Bahasa Indonesia – Inggris Berbasis Corpus Jati Sasongko
Dinamik Vol 15 No 2 (2010)
Publisher : Universitas Stikubank

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.35315/dinamik.v15i2.118

Abstract

Pencarian informasi lintas bahasa pada saat sekarang ini sangat diperlukan dengan banyaknya dokumen yang tersedia dari berbagai macam bahasa. Pencarian informasi lintas bahasa berbasis corpus ini dalam pengembangannya memerlukan beberapa tahapan yang dimulai dari pengumpulan data dokumen penghapusan tanda baca, tokenisasi kata, penghapusan kata berdasarkan stopword sampai dengan memasukkan data ke dalam corpus. Pencarian informasi lintas bahasa dapat bekerja dengan baik tergantung dari banyaknya data yang tersedia di dalam corpus, sehingga semakin banyak data di dalam corpus maka semakin baik hasil pencariaannya.