Claim Missing Document
Check
Articles

Found 3 Documents
Search
Journal : Publikasi Eksternal

IMPLEMENTASI COSINE COEFFICIENT UNTUK PENGUKURAN KEMIRIPAN ANTAR DOKUMEN TEKS BERBAHASA INDONESIA PADA APLIKASI BERBASIS WEB : Prosiding Seminar Nasional MIPA UNNES 24 OKTOBER 2009 utomo, mardi siswo
Publikasi Eksternal 2009
Publisher : Publikasi Eksternal

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (942.991 KB)

Abstract

Jarak antar dokumen atau biasa disebut dengan Kemiripan dokumen ( Document Similarity) biasanya digunakan pada sistem temu kembali informasi. Kemiripan antar dokumen digunakan sebagai acuan pencarian informasi lainya yang sejenis, sehingga dapat mengurangi waktu temu-kembali informasi untuk dokumen berikutnya yang sejenis. Fungsi ini sangat berguna pada korpus dokumen yang besar, sehingga memudahkan pengguna dalam pencarian dokumen-dokumen yang dimaksud. Salah satu cara untuk mengukur jarak antar dokumen adalah menggunakan Cosine Coefficient. Cosine merupakan pendekatan vektor dalam mengukur sudut relevansi antar dokumen. Dokumen harus melalui pemrosesan awal  (preprocessing)  untuk dapat diukur dengan cosine. Pemrosesan dokumen awal dimulai dari analisa token, kemudian dilanjutkan dengan filtering dan terakhir dilakukan proses indek sehingga dihasilkan proximity matrik. Kemudian juga digunakan teknik ekseskusi parsial pada implementasi aplikasinya untuk dapat menangani dokumen-dokumen yang besar. Aplikasi yang dibangun adalah aplikasi berbasis web sehingga mempunyai fleksibilitas tinggi untuk terminal-terminal aksesnya. Aplikasi berbasis web mempunyai waktu ekseskusi yang terbatas, sehingga dibutuhkan ekseskusi parsial untuk menangani dokumen-dokumen yang banyak. Disampaikan di Seminar Nasional MIPA UNNES 24 OKTOBER 2009
KLASTERING BERITA ONLINE TENTANG BENCANA DENGAN ALGORITMA SINGLE PASS CLUSTERING : Prosiding Seminar Nasional MIPA UNNES Tahun 2012 Februariyanti, Herny; Zuliarso, Eri; Utomo, Mardi Siswo
Publikasi Eksternal 2012
Publisher : Publikasi Eksternal

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (1004.566 KB)

Abstract

Terlalu banyak untuk menyebut jenis bencana alam yang datang silih berganti menghampiri Indonesia. Volume berita elektronik berbahasa Indonesia tentang bencana alam yang semakin besar merupakan sumber informasi yang berharga. Clustering dokumen teks adalah salah satu operasi pada text mining untuk mengelompokkan dokumen yang memiliki kesamaan isi. Pengelompokan dokumen berita dibutuhkan untuk mempermudah pencarian informasi mengenai suatu bencana tertentu. Penelitian ini menitik beratkan pada berita on-line, sehingga system harus dapat mengindikasikan apakah dokumen saat ini memuat atau tidak memuat topic bencana sebelum melihat pada dokumen berikutnya. Pendekatan yang dilakukan untuk menyelesaikan masalah menggunakan keterkaitan antar berita ini diukur berdasarkan kemiripan antar dokumen (similarity). Algoritma ini diuji coba dengan menggunakan sampel berita dari media online. Hasil uji coba menunjukkan bahwa algoritma ini dapat diaplikasikan untuk pengelompokan berita-berita berbahasa Indonesia.   Kata Kunci : Information Retrieval, Stemming, Single Pass Clustering, Cosine Similarity.Disampaikan di Seminar Nasional MIPA UNNES Tahun 2012
PERANCANGAN APLIKASI WEB SCRAPING UNTUK KOLEKSI KONTEN RESEP MASAKAN TRADISIONAL JAWA BERBASIS XML Wibisono, Setyawan; Utomo, Mardi Siswo
Publikasi Eksternal 2014
Publisher : Publikasi Eksternal

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (146.427 KB)

Abstract

Proses untuk memisahkan konten utama halaman situs dengan bagian-bagian yang tidak berhubungan dengan isi disebut dengan scraping. Dengan teknik ini konten utama dari suatu halaman situs dapat diekstrak, dikoleksi dan selanjutnya dapat diproses oleh proses pengindekan. Sistem ini adalah perangkat lunak berbasis web dengan tujuan melakukan pengambilan isi dari konten halaman web.Hal-hal yang dapat diwujudkan dalam sistem ini diantaranya: (1) Sistem dapat secara otomatis mengekstrak konten utama dari suatu halaman web, (2) Dalam penelitian ini digunakan halaman dokumen pada situs resmi sebuah produk makanan dengan merk Bango, (3) Pengambilan data/crawling Uniform Resource Locator (URL) pada situs resmi sebuah produk makanan merk Bango menggunakan aplikasi sphider, (4) Hasil scraping resep disimpan dalam basisdata, (5) Sistem ini dapat memproduksi data resep dengan format XML (eXtensible Markup Language), (6) Aplikasi diintegrasikan dalam bentuk plugin CMS wordpress yang dapat diunduh di secara bebas (7) Sistem diimplementasikan secara online menggunakan sebuah situs yang telah disiapkan.Teknik web scraping dapat digunakan untuk mengambil konten resep pada situs pada berbagai situs yang memuat resep masakan. Penyimpanan resep ke dalam basisdata, mempermudah transformasi data ke bentuk lainnya. Disajikan di Seminar Nasional Teknologi Industri, Universitas Trisakti Juli 2014