Claim Missing Document
Check
Articles

Found 14 Documents
Search
Journal : eProceedings of Engineering

Implementasi Metode Document Oriented Index Pruning Pada Information Retrieval System Hendri Priyanto; Yanuar Firdaus Arie Wibowo; Siti Sa'adah
eProceedings of Engineering Vol 3, No 1 (2016): April, 2016
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Perkembangan Informasi yang sangat pesat mengakibatkan jumlah informasi yang tersedia secara online mengalami peningkatan yang sangat pesat, sehingga sangat sulit apabila pencarian dilakukan secara satu-persatu, karenanya dibutuhkan Information Retrieval System untuk menemukan suatu informasi. Permasalahan yang muncul pada Information Retrieval adalah semakin besar data collection yang dimiliki maka semakin besar pula biaya yang dibutuhkan untuk menyediakan layanan komputasi, storage, dan network resource. Oleh karena itu suatu metode diperlukan untuk mengatasi permasalahan tersebut yaitu dengan kompresi index. Metode kompresi index yang akan digunakan adalah metode Document Oriented Index Pruning. Berdasarkan penelitian yang telah dilakukan sampai dengan persentase index sebesar 80% metode Document Oriented Index Pruning mampu memberikan hasil relevansi pencarian yang lebih baik dibandingkan hasil relevansi pencarian tanpa menggunakan metode Document Oriented Index Pruning sehingga performansi sistem yang dihasilkan lebih baik dibandingkan dengan tanpa menggunakan metode Document Oriented Index Pruning. Kata kunci:information retrieval , document oriented index pruning, indexing
Analisis Dan Implementasi Pengukuran Semantic Relatedness Menggunakan Salient Semantic Analysis Dengan Keyword Extraction Sebagai Preprocessing Bagus Ardisaputra; Moch. Arif Bijaksana; Siti Sa'adah
eProceedings of Engineering Vol 2, No 2 (2015): Agustus, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak Pengukuran besar relasi antar kata atau teks mempunyai kendala pada pengimplementasian sistem yaitu memerlukan pengetahuan dalam jumlah banyak. Sistem yang ada juga harus dapat melakukan abstraksi dan generalisasi. Pengukuran ini yang disebut sebagai semantic relatedness. Semantic relatedness adalah salah satu pengukuran dalam text mining yang merepresentasikan hubungan antar kata atau teks. Pada tugas akhir ini digunakan metode salient semantic analysis dan keyword extraction untuk mendapatkan nilai semantic relatedness antar kata dan antar teks. Metode ini dipilih karena mampu menghitung nilai semantic relatedness antar kata dan teks dengan tingkat akurasi yang baik. Dari uji skenario yang dilakukan, didapatkan nilai korelasi tertinggi untuk antar kata sebesar 0.2137 dan akurasi tertinggi untuk antar teks sebesar 83.3%. Kata kunci : semantic relatedness, salient semantic analysis, keyword extractio
Penerapan Teknik Data Mining Untuk Klasifikasi Ketepatan Waktu Lulus Mahasiswa Teknik Informatika Universitas Telkom Menggunakan Algoritma Naive Bayes Classifier Naziah Amalia; Shaufiah Shaufiah; Siti Sa'adah
eProceedings of Engineering Vol 2, No 3 (2015): Desember, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Ketepatan waktu lulus mahasiswa merupakan hal yang penting bagi sebuah universitas karena merupakan salah satu syarat akreditasi, tak terkecuali Universitas Telkom. Universitas Telkom merupakan salah satu universitas swasta di Indonesia yang menawarkan berbagai program studi, salah satunya Teknik Informatika. Program studi tersebut menerima kurang lebih 640 mahasiswa setiap tahunnya. Namun, jumlah mahasiswa tersebut tidak diimbangi dengan mahasiswa yang lulus tepat waktu. Mahasiswa yang lulus tepat waktu hanya mencapai kisaran 15% setiap tahunnya. Banyak aspek yang menyebabkan mahasiswa lulus tidak tepat waktu. Beberapa diantaranya adalah kota asal, jumlah SKS, IPK, berapa kali mengambil mata kuliah TA, dan masih banyak lagi aspek yang bisa mempengaruhi ketepatan waktu lulus. Ketepatan waktu lulus tersebut dapat diklasifikasikan berdasarkan aspek yang ada. Pada Tugas Akhir ini, dilakukan klasifikasi ketepatan waktu lulus dengan menggunakan algoritma Naive Bayes Classifier. Algoritma tersebut dibangun dengan menggunakan Java Netbeans. Pengujian dilakukan untuk mengetahui titik optimum dari algoritma Naive Bayes Classifier. Hasil pengujian dengan perbandingan data tersebut didapatkan akurasi sebesar 91%. Titik optimum algoritma tersebut berada pada pembagian data dengan perbandingan 90% data training dan 10% data testing. Berdasarkan pengujian yang dilakukan per atribut, faktor yang mempengaruhi ketepatan waktu lulus merupakan atribut TA1, karena memiliki prosentase yang paling tinggi dibandingkan atribut yang lain.
Klasifikasi Argumen Semantik Menggunakan Kombinasi Fitur Named Entities In Constituent, Head Word Pos, Dan Syntactic Frame Nisaa' 'Ainulfithri; Moch. Arif Bijaksana; Siti Sa'adah
eProceedings of Engineering Vol 2, No 2 (2015): Agustus, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak  Natural Language Processing (NLP) merupakan salah satu cabang ilmu komputer yang berfokus pada pengolahan bahasa natural/bahasa manusia. Sebagian besar task NLP   seperti Question Answering, Semantic Role Labeling, dan Information Extraction memerlukan informasi 5W (Who, What, Where, When, Why)  dan  1H  (How)  untuk  mengekstrak  informasi  yang  dibutuhkan.  Klasifikasi  argumen  semantik merupakan proses pelabelan argumen berdasarkan aturan semantik dimana aturan semantik dapat merepresentasikan informasi 5W+1H tersebut. Dalam melakukan klasifikasi argumen semantik diperlukan fitur-fitur yang dapat membantu proses klasifikasi. Pada penelitian ini, fitur yang akan digunakan adalah fitur dasar dan tiga fitur tambahan yaitu Named Entities in Constituent, Head Word POS, dan Syntactic Frame. Penggunaan ketiga fitur tambahan tersebut terbukti dapat meningkatkan akurasi. Algoritma yang digunakan dalam proses klasifikasi adalah Sequential Minimum Optimization (SMO) yang merupakan pengembangan dari Support Vector Machine (SVM). Algoritma SMO dapat mengatasi permasalahan multi-class dan dapat melakukan proses learning dengan waktu yang lebih singkat daripada SVM. Berdasarkan pengujian yang telah dilakukan, penggunaan tiga fitur tambahan yaitu Named Entities in Constituent, Head Word POS, dan Syntactic Frame dapat meningkatkan hasil akurasi dengan kenaikan akurasi sebesar 11,82%. Kata  kunci  :  klasifikasi  argumen  semantik,  Sequential  Minimum  Optimization  (SMO),  Natural Language Processing (NLP), Named Entities in Constituent, Head Word POS, Syntactic Frame