Claim Missing Document
Check
Articles

Found 4 Documents
Search
Journal : Semantik

Algoritma Latent Semantic Analysis (LSA) Pada Peringkas Dokumen Otomatis Untuk Proses Clustering Dokumen Luthfiarta, Ardytha; Zeniarja, Junta; Salam, Abu
Semantik Vol 3, No 1 (2013): Semantik 2013
Publisher : Semantik

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Teknologi pengklasteran dokumen memiliki peran yang signifkan dalam kemajuan teknologi informasi, diantaranya mempunyai peranan penting dalam pengembangan web di bidang akurasi kategorisasi keyword otomatis pada search engine, kategorisasi berita untuk surat kabar elektronik, peningkatan rating situs dengan teknologi Search Engine Optimization (SEO) dan sangat memungkinkan untuk diimplementasikan dalam berbagai teknologi informasi lainnya, oleh karena  itu diperlukan penelitian untuk meningkatkan ketepatan akurasi dalam pengklasteran dokumen. Dalam penelitian ini Algoritma  Latent Semantic Analysis  (LSA) dapat melakukan proses reduksi kalimat dengan lebih baik dibandingkan algoritma Feature Based sehingg a mendapatkan hasil akurasi proses clustering dokumen yang lebih akurat.Beberapa tahapan clustering dalam penelitian ini, yaitu preprocessing, peringkas dokumen otomatis  dengan metode fitur,  peringkas dokumen otomatis dengan  LSA, pembobotan kata,  dan algoritma clustering.Hasil penelitian menunjukkan  tingkat akurasi menggunakan peringkas dokumen otomatis  dengan LSA dalam  proses clusteringdokumen  mencapai  71,04  %yang diperoleh pada tingkat peringkas dokumen otomatisdengan  LSA  40%  dibandingkan dengan hasil clustering tanpa peringkas dokumen otomatis yang hanya mencapai tingkat akurasi 65,97  %.
Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction Junta Zeniarja; Abu Salam; Ardytha Luthfiarta; L Budi Handoko; Muhammad Jamhari
Semantik Vol 3, No 1 (2013): Semantik 2013
Publisher : Semantik

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (599.107 KB)

Abstract

Proses  clustering dokumen memudahkan pengguna menemukan dokumen yang diinginkan. Dalam prosesnya  dokumen  yang akan dicluster  direpresentasikan menggunakan Vector Space Model (VSM). Masalah  klasik  dalam VSM adalah matrik term-dokumen  yang  sangat jarang (banyak mengandung angka 0 dalam term-dokumen matrik) dan juga  berdimensi tinggi, sehingga dapat mengurangi kinerja clustering dokumen. Oleh karena itu diperlukan suatu metode untuk bisa mengurangi dimensi term-dokumen dan menghilangkan term yang bernilai 0 tersebut sehingga dapat meningkatkan kinerja proses clustering. Dalam penelitian ini diusulkan model peringkas dokumen otomatis  dengan penggabungan metode fitur dan latent semantic analysis (LSA) sebagai feature reduction pada proses clustering dokumen.Tujuan dari penelitian ini adalah untuk meningkatkan akurasi dari clustering dokumen dengan pengkombinasian metode padaperingkas dokumen otomatis yang diintegrasikan sebagai feature reduction. Beberapa tahapan clustering dalam penelitian ini, yaitu preprocessing, peringkas dokumen otomatis  dengan metode fitur ,LSA dan Kombinasi, pembobotan kata, feature selection, feature transformation dan algoritma clustering.   Hasil penelitian menunjukkan  tingkat akurasi menggunakan peringkas dokumen  otomatis yang diintegrasikan sebagai feature reduction  dengan menggabungkan metode fitur dan metode LSA  mencapai 93,33  %  yang diperoleh pada tingkat peringkas dokumen otomatis  LSA Summary + Feature Summary 50% + Feature Selection 20% + LSA  dibandingkan dengan feature selection 20 % tanpa menggunakan peringkas dokumen otomatis yang hanya mencapai tingkat akurasi 89,33 %.
RANCANG BANGUN SISTEM INFORMASI PENGELOLAAN DOKUMEN TANGIBLE CULTURAL HERITAGE Khafiizh Hastuti; Abu Salam; Budi Handoko; Erwin Yudi Hidayat
Semantik Vol 4, No 1 (2014): Semantik 2014
Publisher : Semantik

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (309.076 KB)

Abstract

The geographical position of Central Java  which  is  in  the middle of  the island of  Java,making it a “meltingpot”of cultures  as well  as the  cultural center  of Java  island.  Cultural  heritage  is dividedinto  tangible  cultural  heritage  and  intangible  cultural heritage.  Tangible  cultural heritage  is  the work of  the human  body  that  can  be moved  or  moving,  or  that  cannot  be moved  or  did not  move.Department of Culture  and    Tourism of  Central  Java has documented  manually  cultural  heritagebut very vulnerable to damage. There are also many cultural  heritages that have not been recorded. The process of data collection and recording are very difficult, since the datasources are scatteredand  not well organized.  Documentation  of cultural heritage  in Central Java  can  be used  as  a information    system  database  fora wide range of  cultura  linterests  in  Central Java.  The aim is tofacilitate  and  ease  The  Department of  Culture  and Tourism of  Central  Java  to  documents and records cultural heritage collections for the category of tangible cultural heritage. In the long-term plan, this system can be used  as a reference by another region, thus forming the  national cultural heritage documentation system.
INTEGRASI PERINGKAS DOKUMEN OTOMATIS SEBAGAI FEATURE REDUCTION PADA CLUSTERING DOKUMEN Abu Salam; Catur Supriyanto; Amiq Fahmi
Semantik Vol 2, No 1 (2012): Prosiding Semantik 2012
Publisher : Semantik

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (1035.638 KB)

Abstract

Clustering dokumen merupakan proses pengelompokan dokumen yang memiliki kesamaan topik, clustering dokumen memudahkan pengguna menemukan dokumen yang diinginkan. Dalam proses clustering dokumen, dokumen direpresentasikan menggunakan Vector Space Model (VSM). Masalah dalam VSM adalah matrik term-dokumen biasanya sangat jarang (banyak mengandung angka 0 dalam term-dokumen matrik) dan juga mempunyai dimensi tinggi, sehingga masalah-masalah ini dapat mengurangi kinerja clustering dokumen. Oleh karena itu diperlukan suatu metode untuk bisa mengurangi dimensi term-dokumen dan menghilangkan term yang bernilai 0 tersebut sehingga dapat meningkatkan kinerja proses clustering. Dalam penelitian ini diusulkan model peringkas dokumen otomatis sebagai feature reduction pada proses clustering dokumen.Tujuan dari penelitian ini adalah untuk meningkatkan akurasi dari clustering dokumen dengan mengintegrasikan peringkas dokumen otomatis sebagai feature reduction. Ada beberapa tahapan clustering dalam penelitian ini, yaitu preprocessing, peringkas dokumen otomatis, pembobotan kata, feature selection, feature transformation dan algoritma clustering. Tahap Preprocessing yang digunakan dalam penelitian ini adalah tokenization, stopword, stemming dan pemenggalan kalimat. Proses peringkas dokumen otomatis ditujukan untuk penyeleksian kalimat agar didapatkan ringkasan teks yang diperoleh dengan menyajikan kembali bagian tulisan yang dianggap topik utama tulisan dengan bentuk yang lebih disederhanakan baru kemudian selanjutnya dilakukan proses pembobotan kata, feature selection, feature transformation dan clustering. Hasil penelitian menunjukkan bahwa integrasi peringkas dokumen otomatis sebagai feature reduction dapat meningkatkan kinerja clustering dokumen sampai dengan 91,7 %, mengalami peningkatan dari tingkat akurasi 89,6 % untuk proses feature reduction tanpa menggunakan peringkas dokumen otomatis. Kemudian pengaruh Integrasi peringkas dokumen otomatis sebagai feature reduction untuk waktu komputasi yang dibutuhkan adalah pada % feature selection yang semakin kecil integrasi peringkas dokumen otomatis sebagai feature reduction membutuhkan tambahan waktu komputasi tersendiri, akan tetapi pada proporsi feature selection yang semakin besar, % peringkas dokumen otomatis dapat menurunkan waktu komputasi yang digunakan.Kata kunci: Text mining; Clustering Dokumen; Peringkas Dokumen Otomatis.