Claim Missing Document
Check
Articles

Found 26 Documents
Search
Journal : eProceedings of Engineering

Implementasi Word Sense Disambiguation Dengan Metode Maximal Marginal Relevance Pada Peringkasan Teks Bening Suryani Pratiwi; Shaufiah Shaufiah; Moch. Arif Bijaksana
eProceedings of Engineering Vol 4, No 1 (2017): April, 2017
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Dalam meringkas sebuah teks terdapat permasalahan yang muncul dan mempengaruhi hasil dari peringkasan teks tersebut. Permasalahan yang muncul seperti ambiguitas kata dan redundansi. Untuk meningkatkan kualitas dari peringkasan teks tersebut maka, permasalahan ambiguitas dan redundansi harus diatasi. Sehingga pada tugas akhir ini dilakukan peringkasan teks pada single dokumen yang mengimplementasi Word Sense Disambiguation dengan metode Maximal Marginal Relevance. Tahapan yang dilakukan terdiri dari Preprocessing, Word Sense Disambiguation, perhitungan Cosine Similarity, perhitungan Maximal Marginal Relevance, dan evaluasi. Pada tahapan preprocessing dilakukan cleaning pada data seperti stopwords removal, tokenization, remove tag, lemmatization dan stemming. Proses Word Sense Disambiguation dipilih untuk mengatasi masalah ambigu pada term dan diganti dengan synset term pada peringkasan teks tersebut. Pada peringkasan ini akan menggunakan cosine similarity untuk mengukur kemiripan setiap kalimat dengan kalimat pada keseluruhan isi dokumen. Sedangkan metode Maximal Marginal Relevance digunakan untuk merangking ulang hasil dari perhitungan cosine similarity dan memilih kalimat dengan nilai MMR paling tinggi yang akan dijadikan summary dengan nilai compresion rate yang ditentukan. Metode MMR termasuk metode yang sederhana namun efisien untuk mengurangi redundansi. Hasil peringkasan teks otomatis ini selanjutnya dievalusi dan dianalisis dengan pengukuran precision, recall, dan F-Measure dan dilihat dari hasil survey pembaca terhadap summary yang dihasilkan. Dengan nilai Recall 35%, Precision 21%, dan F-Measure 25%. Kata kunci : Word Sense Disambiguation, Maximal Marginal Relevance, Cosine Similarity.
Analisis Penggunaan Association Rule Learning Pada Real-time Business Intelligence Dengan Data Stream Mining Faizal Hendyansyah Khrisdian; Shaufiah Shaufiah; Shinta Yulia Puspitasari
eProceedings of Engineering Vol 2, No 3 (2015): Desember, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Dengan semakin berkembangnya teknologi, kebutuhan pemrosesan data menjadi semakin cepat. Semakin banyaknya data yang mengalir, menuntut proses analisis data yang cepat sehingga dapat menghasilkan keputusan dengan tingkat keterlambatan minimum. Tidak hanya pada level managerial atau strategis saja sebuah sistem business intelligence dibutuhkan, bahkan pada level operasional pun sudah mulai membutuhkan sistem business intelligence untuk meningkatkan efektifitas dan efisiensi kerja. Oleh sebab itu, dibangunlah sebuah sistem real-time business intelligence yang dituntut bekerja cepat untuk membantu kinerja pada level operasional. Dalam tugas akhir ini, dilakukan penelitian tentang sebuah sistem real-time business intelligence untuk memprediksi delay pada penerbangan pesawat pada PT Garuda Indonesia menggunakan metode association rule learning dengan algoritma apriori. Data penerbangan akan dilakukan preprocessing sebelumnya dengan cara menghilangkan data yang memiliki missing value dan melakukan perubahan data untuk merubah data yang berbentuk string menjadi integer agar dapat dihitung. Data tersebut nantinya akan diolah dan digali agar membentuk informasi atau pengetahuan yang dapat digunakan sebagai dasar pengambilan keputusan. Hasil dari proses real-time analytic akan dimasukkan ke dalam beberapa skenario pengujian dengan jumlah minimum support dan minimum confident yang berbeda, dan juga dengan proses penggunaan apriori yang berbeda. Kata Kunci : Real-time Business Intelligence, Delay, Association Rule Learning, Apriori.
Stemming Words Dengan N-Gram Dan Lexeme Based Untuk Teks Berbahasa Korea Nadya Eka Putri Permadi; Shaufiah Shaufiah; Mira Kania Sabariah
eProceedings of Engineering Vol 2, No 1 (2015): April, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Bahasa Korea termasuk ke dalam bahasa aglutinatif yang termasuk unik dan memiliki berbagai jenis pelekatan morfem, dengan kondisi ini, pengaplikasian teknik stemming words dianggap sedikit sulit untuk dilakukan. Beberapa penelitian sudah dilakukan, namun masih ditemui beberapa kesalahan dikarenakan adanya keunikan dari karakter kata dalam Bahasa Korea. Dalam penelitian kali ini akan dibahas teknik baru untuk melakukan stemming words atau pencarian kata dasar disertai dengan deteksi imbuhannya. Penelitian ini bertujuan untuk membentuk kata dasar dari kata kerja berimbuhan pada bahasa Korea dan mencari jenis dan arti dari imbuhan yang melekat pada kata tersebut. Penelitian ini dilakukan dengan menggabungkan metode N-gram dan Lexeme Based. Dalam pencarian kata dasar ini sejumlah kata kerja yang mendapat imbuhan dalam tata bahasa tertentu dipecah untuk menghasilkan kata dasar dan imbuhan yang sesuai. Pemecahan kata berimbuhan dilakukan dengan metode N- gram dan dilanjutkan dengan pengaplikasian metode Lexeme Based untuk pencarian kata dasar serta jenis dan arti imbuhan. Hasil yang didapatkan pada penelitian ini adalah pembentukan kata dasar dan imbuhan yang disertai dengan jenis imbuhan serta arti dari imbuhan tersebut. Kata kunci : stemming words, Bahasa Korea, N-gram, Lexeme Based, aglutinatif.
Analisis Dan Implementasi Pencocokan String Berdasarkan Kemiripan Pengucapan (phonetic String Matching) Menggunakan Algoritma Metaphone Dalam Pencarian Ayat Al-qur’an Tegar Graha Adiwiguna; Moch. Arif Bijaksana; Shaufiah Shaufiah
eProceedings of Engineering Vol 2, No 2 (2015): Agustus, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak Telah ditemukan penelitian baru yang membuat Al-Qur’an dalam versi digital. Akan tetapi, pada umumnya perangkat lunak yang telah ada hanya menggunakan teknik Exact String Matching untuk melakukan pencarian informasi (ayat). Dan jika pengguna perangkat lunak ini salah dalam penulisan inputan maka perangkat lunak tidak akan memberikan solusi dari apa yang diinginkan oleh pengguna. Oleh karena itu, tujuan penelitian ini adalah membangun sistem pencarian dengan teknik fonetik atau pencocokan kata berdasarkan pengucapan (Phonetic String Matching) yang dapat digunakan untuk mengatasi permasalah tersebut. Dengan menggunakan Algoritma Metaphone dan Dice Similarity, sistem pencarian ayat Al-Qur’an ini akan melakukan pencocokan string berdasarkan pengucapan dengan nilai precision sebesar 54% dan nilai recall sebesar 100%. Juga korelasi yang didapatkan sebesar 82%.
Analisis Dan Implementasi Pencarian Ayat Al-quran Berbasis Fonetis Menggunakan Metode N-gram Muhammad Fakhri Ar-Razi; Moch. Arif Bijaksana; Shaufiah Shaufiah
eProceedings of Engineering Vol 2, No 2 (2015): Agustus, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak Mencari ayat di Al-Qur’an tidak mudah bagi pengguna yang tidak memiliki cukup pengetahuan dan kemampuan dalam bahasa Arab. Oleh karena itu, pencarian fonetis dapat digunakan untuk mempermudah pengguna untuk mencari ayat dalam Al-Qur’an sesuai dengan pengucapan dan penulisan pengguna. Tugas akhir ini bertujuan untuk membangun system pencarian tersebut, khusus untuk penutur Bahasa Indonesia. Sebuah metode n-gram yang digabungkan dengan pengodean fonetis mengenai aturan bacaan Quran diusulkan untuk mencocokkan antara teks Al-Qur’an transliterasi yang sudah diubah ke dalam aksara latin (sesuai penuturan Bahasa Indonesia) dan query pengguna dalam aksara latin. Dilakukan pengindeksan dari trigram yang digunakan untuk perkiraan pencocokan string. Sistem ini menggunakan 2 skema pencarian yaitu pencarian dengan huruf vokal dan tanpa vokal yang sudah dibandingkan keduanya dan pencarian dengan vokal yang lebih baik; 2 metode pemeringkatan yaitu jumlah trigram dan letak posisi trigram. Dari hasil yang sudah diuji didapatkan presisi yang cukup baik dengan skema pencarian menggunakan vokal sebesar 0.746, sedangkan dengan skema pencarian tanpa vokal sebesar 0.515. Setelah menggabungkan 2 metode pemeringkatan dan menggunakan skema pencarian dengan vokal didapatkan nilai recall sebesar 0.79, serta didapatkan nilai korelasi yang cukup besar yaitu 0.907 dan sistem juga dapat menerima berbagai macam variasi query dengan baik.
Analisis Dan Implementasi Mesin Focused Crawler Untuk Web Musik Dengan Menggunakan Learning Anchor Algorithm Madina Ulfa; Shaufiah Shaufiah; Hetti Hidayati
eProceedings of Engineering Vol 2, No 3 (2015): Desember, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Perkembangan world-wide web yang semakin pesat diikuti oleh kebutuhan informasi yang semakin meningkat, menjadi tantangan yang belum pernah terjadi sebelumnya untuk general-purpose crawler dan search engines. Search engine seperti Google, Yahoo!, Altavista dan sebagainya telah diperkenalkan dan digunakan untuk mempermudah pencarian informasi di Internet. Web Crawler (crawler) adalah sebuah program/script otomatis yang memproses halaman web untuk sebuah mesin pencari, yang banyak digunakan saat ini. Namun mengingat banyaknya halaman web yang ada, maka seringkali search engine dengan crawler biasa tidak dapat memberikan hasil yang maksimal. Untuk itu dikembangkanlah focused crawler. Focused crawler akan men-download halaman web yang sesuai topik dan berhati-hati memutuskan URL mana yang akan di-scan dan dalam urutan apa dilanjutkan berdasarkan informasi halaman download sebelumnya. Untuk tugas akhir ini, yang akan diproses adalah web musik. Focused crawler membutuhkan classifier untuk membedakan halaman web yang relevan dan tidak. Yang pada tugas akhir ini digunakan Naïve Bayes Classifier. Halaman web yang relevan akan diekstrak outgoing-linknya dan disimpan kedalam frontier. Link dapat dicrawl dengan menggunakan algoritma penelusuran. Pemilihan algoritma penelusuran yang tepat akan berpengaruh pada efisiensi web crawler. Pada tugas akhir ini yang akan digunakan adalah Learning Anchor Algorithm. Berdasarkan implementasi, dihasilkan akurasi terbaik 100% pada link pengujian http://gigsplay.com/ dengan dataset 100 musik dan 100 nonmusik. Sedangkan akurasi terendah 86.7% saat dataset 300 musik dan 200 nonmusik pada link pengujian http://musik.kapanlagi.com/. Kata Kunci : focused crawler, web olahraga, naïve bayes, Learning Anchor Algorithm.
Rekomendasi Pengambilan Mata Kuliah Pilihan Menggunakan Recursive Elimination Algorithm (Relim) Satrio Prasojo; Shaufiah Shaufiah; Hetti Hidayati
eProceedings of Engineering Vol 2, No 1 (2015): April, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Pada proses perkuliahan, setiap mahasiswa pada proses registrasi wajib melakukan tahapan perwalian. Mahasiswa biasanya mengajukan mata kuliah apa saja yang akan diambilnya kepada dosen wali, setelah itu dosen wali akan memberikan saran terkait mata kuliah apa saja yang sebaiknya diambil, terutama mata kuliah pilihan. Demi memudahkan proses tersebut, dibuatlah sebuah sistem yang menangani perekomendasian. Sistem ini memanfaatkan teknik data mining menggunakan algoritma Recursive Elimination (Relim). Data yang diproses akan dipadatkan menggunakan parameter minimum support. Implementasi yang dilakukan terbukti dapat menghasilkan rekomendasi mata kuliah pilihan dengan aturan asosiasi yang menggunakan nilai support dan confidence sebagai acuannya. Kata kunci : rekomendasi, Relim, minimum support, support, confidence
Sentiment Analysis Berbahasa Indonesia Menggunakan Improved Multinomial Naive Bayes Muhammad Adib Imtiyazi; Shaufiah Shaufiah; Moch. Arif Bijaksana
eProceedings of Engineering Vol 2, No 2 (2015): Agustus, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

ABSTRAKSI Penggunaan Multinomial Naïve Bayes sebagai classifier dalam kasus sentiment analysis sudah jamak dilakukan, namun penggunaan TF-IDF sebagai feature weighting dalam kasus tersebut dirasa kurang sesuai karena pada kasus sentiment analysis, karena sifat dari TF-IDF itu sendiri yang lebih mementingkan frequency kemunculan kata. Oleh karena itu, digunakanlah algoritma Improved Multinomial Naïve Bayes yang menggunakan Improved Gini Index (TF- iGini) dalam pembobotan yang dianggap lebih tepat sehingga dapat menghasilkan performansi yang lebih baik. Pada tugas akhir ini dilakukan perbandingan performansi dari Multinomial Naïve Bayes + TF-IDF dan Multinomial Naïve Bayes + TF-iGini. Hasil percobaan menunjukkan bahwa iGini mampu memberikan hasil yang cukup baik jika dibandingankan dengan IDF pada Multinomial Naïve Bayes, namun tidak cukup baik untuk menggantikan fungsi IDF dalam kasus klasifikasi sentiment. Kata kunci: sentiment analysis, feature weighting, IDF, improved gini, Multinomial Naïve Bayes, Bahasa Indonesia.
Analisis Algoritma Rp-gd Dalam Kualitas Peringkasan Graf Dari Basisdata Graf Defrianda Rizky Pranata; Kemas Rahmat Saleh Wibowo; Shaufiah Shaufiah
eProceedings of Engineering Vol 2, No 2 (2015): Agustus, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak Basisdata graf merupakan representasi dari pemodelan suatu koleksi data ke dalam bentuk Node dan Edge. Basisdata Graf juga merupakan sebuah bentuk atau model dari database yang menyediakan solusi efektif dan efisien terhadap penyimpanan data . Dikembangkan di era bigdata seperti sekarang ini merupakan terobosan baru di bidang Computer Science khususnya Data Engineering. Terdiri dari Edges, Nodes, dan Properties yang digunakan untuk merepresentasikan dan menyimpan data. Bersifat index-free adjacency yang berarti bahwa setiap elemen berisi pointer langsung ke elemen yang berdekatan dan tidak ada pencarian indeks diperlukan. Database grafik umum yang dapat menyimpan grafik pun berbeda dari database grafik khusus seperti triplestores dan database jaringan. Ketika hanya menggunakan model database yang berbentuk relational database tentunya semakin lama semakin kesulitan karena datanya disini sangatlah banyak sekali. Disinilah penulis akan menggunakan model database yang masih tergolong baru, yaitu Graph Database. Model ini dapat merepresentasikan banyak data dalam suatu graf yang bisa dianalisis serta diambil kesimpulannya dari banyak simpul serta busur yang penulis peroleh dari dataset molekuler ikatan kimia. Dengan menggunakan model ini, tentunya dapat dilihat ringkasan molekuler yang dapat dilihat dari analisa dan peringkasan basisdata graf yang penulis ambil sebagai topik dari penulisan karya ini. Metode peringkasan yang penulis ambil adalah RP-GD Algorithm yang penulis gunakan mempunyai efisiensi dan kualitas yang dapat meringkas suatu basisdata graf. Diharapkan algoritma tersebut bisa meningkatkan kualitas dari sebuah graph database sehingga peringkasan dari model tersebut mempunyai hasil yang maksimal dalam merepresentasikan molekuler ikatan kimia dari dataset tersebut. Dari hasil pengujian dan analisis, maka terbukti bahwa algoritma RP-GD dapat digunakan dalam peringkasan basisdata graf, serta menghasilkan kualitas yang baik dalam pemrosesan maupun hasilnya. Dilihat dari jumlah nodes dan edges hasil peringkasan lalu cakupan informasi dan rasio peringkasan menjadi parameter yang menunjukkan hasil tersebut. Variasi hasil peringkasan juga dapat dilakukan sesuai dengan minimum support yang diinginkan. Nilai cakupan informasi dari sebuah ringkasan basisdata graf berbanding lurus dengan nilai minimum support yang diberikan, sedangkan rasio peringkasan berbanding terbalik dengan nilai minimum support yang diberikan. Kata Kunci : Graph Database, RP-GD Algorithm, dataset SMILES, summarization graph, summariation quality, chemical compounds, chemical informatics
Implementasi Metode Entropy Dan Oreste Pada Rekruitasi Karyawan Ludwika Hermawan; Mahmud Imrona; Shaufiah Shaufiah
eProceedings of Engineering Vol 1, No 1 (2014): Desember, 2014
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Rekruitasi karyawan adalah salah satu proses penting dalam kegiatan sebuah perusahaan. Suatu pekerjaan tertentu membutuhkan kualifikasi tertentu bagi setiap karyawan yang akan bekerja dalam bidang tersebut. Calon karyawan juga memiliki kriteria khusus dan kualifikasi khusus yang dibutuhkan dalam bidang tertentu agar kualitas perusahaan tetap terjaga dan diharapkan bisa meningkat. Dalam proses rekruitasi di perusahaan terdapat sistem yang digunakan untuk membantu dan merekomendasikan proses pemilihan karyawan yang tepat untuk bidang pekerjaan yang tepat. Sistem tersebut melakukan pengolahan data (nilai) untuk memilih karyawan. Metode yang digunakan pada sistem ini adalah entropy dan oreste. Metode entropy digunakan dalam pembobotan dan penentuan tingkat kepentingan kriteria karena entropy sesuai digunakan untuk data yang memiliki variasi tinggi. Metode oreste digunakan dalam perankingan karena metode oreste adalah metode yang menitkberatkan bahwa kriteria yang terbaik adalah yang memiliki banyak keunggulan dalam banyak kriteria. Selain itu metode oreste menggunakan data dalam bentuk ordinal dimana dalam rekruitasi ini sebagian sub kriteria umum dan kriteria khusus menggunakan penilaian dalam bentuk ordinal. Dalam kasus ini proses rekruitasi karyawan menggunakan data sebanyak 294 calon karyawan dari 5 periode rekruitasi yang terbagi dalam 4 bidang pekerjaan yang diambil dari perusahaan Clarisense Digital Media. Dari 294 calon karyawan terpilih 45 karyawan. Pengujian aplikasi rekruitasi karyawan menggunakan metode entropy dan oreste terhadap data 5 periode rekruitasi didapatkan tingkat kecocokan rata-rata untuk setiap bidang pekerjaan per periode rekruitasi sebesar 81.75%. Kata Kunci : rekruitasi karyawan, entropy, oreste, pembobotan, perankingan