Claim Missing Document
Check
Articles

Found 38 Documents
Search

Analisis Dan Implementasi Pencarian Ayat Al-quran Berbasis Fonetis Menggunakan Metode N-gram Muhammad Fakhri Ar-Razi; Moch. Arif Bijaksana; Shaufiah Shaufiah
eProceedings of Engineering Vol 2, No 2 (2015): Agustus, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak Mencari ayat di Al-Qur’an tidak mudah bagi pengguna yang tidak memiliki cukup pengetahuan dan kemampuan dalam bahasa Arab. Oleh karena itu, pencarian fonetis dapat digunakan untuk mempermudah pengguna untuk mencari ayat dalam Al-Qur’an sesuai dengan pengucapan dan penulisan pengguna. Tugas akhir ini bertujuan untuk membangun system pencarian tersebut, khusus untuk penutur Bahasa Indonesia. Sebuah metode n-gram yang digabungkan dengan pengodean fonetis mengenai aturan bacaan Quran diusulkan untuk mencocokkan antara teks Al-Qur’an transliterasi yang sudah diubah ke dalam aksara latin (sesuai penuturan Bahasa Indonesia) dan query pengguna dalam aksara latin. Dilakukan pengindeksan dari trigram yang digunakan untuk perkiraan pencocokan string. Sistem ini menggunakan 2 skema pencarian yaitu pencarian dengan huruf vokal dan tanpa vokal yang sudah dibandingkan keduanya dan pencarian dengan vokal yang lebih baik; 2 metode pemeringkatan yaitu jumlah trigram dan letak posisi trigram. Dari hasil yang sudah diuji didapatkan presisi yang cukup baik dengan skema pencarian menggunakan vokal sebesar 0.746, sedangkan dengan skema pencarian tanpa vokal sebesar 0.515. Setelah menggabungkan 2 metode pemeringkatan dan menggunakan skema pencarian dengan vokal didapatkan nilai recall sebesar 0.79, serta didapatkan nilai korelasi yang cukup besar yaitu 0.907 dan sistem juga dapat menerima berbagai macam variasi query dengan baik.
Analisis Dan Implementasi Mesin Focused Crawler Untuk Web Musik Dengan Menggunakan Learning Anchor Algorithm Madina Ulfa; Shaufiah Shaufiah; Hetti Hidayati
eProceedings of Engineering Vol 2, No 3 (2015): Desember, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Perkembangan world-wide web yang semakin pesat diikuti oleh kebutuhan informasi yang semakin meningkat, menjadi tantangan yang belum pernah terjadi sebelumnya untuk general-purpose crawler dan search engines. Search engine seperti Google, Yahoo!, Altavista dan sebagainya telah diperkenalkan dan digunakan untuk mempermudah pencarian informasi di Internet. Web Crawler (crawler) adalah sebuah program/script otomatis yang memproses halaman web untuk sebuah mesin pencari, yang banyak digunakan saat ini. Namun mengingat banyaknya halaman web yang ada, maka seringkali search engine dengan crawler biasa tidak dapat memberikan hasil yang maksimal. Untuk itu dikembangkanlah focused crawler. Focused crawler akan men-download halaman web yang sesuai topik dan berhati-hati memutuskan URL mana yang akan di-scan dan dalam urutan apa dilanjutkan berdasarkan informasi halaman download sebelumnya. Untuk tugas akhir ini, yang akan diproses adalah web musik. Focused crawler membutuhkan classifier untuk membedakan halaman web yang relevan dan tidak. Yang pada tugas akhir ini digunakan Naïve Bayes Classifier. Halaman web yang relevan akan diekstrak outgoing-linknya dan disimpan kedalam frontier. Link dapat dicrawl dengan menggunakan algoritma penelusuran. Pemilihan algoritma penelusuran yang tepat akan berpengaruh pada efisiensi web crawler. Pada tugas akhir ini yang akan digunakan adalah Learning Anchor Algorithm. Berdasarkan implementasi, dihasilkan akurasi terbaik 100% pada link pengujian http://gigsplay.com/ dengan dataset 100 musik dan 100 nonmusik. Sedangkan akurasi terendah 86.7% saat dataset 300 musik dan 200 nonmusik pada link pengujian http://musik.kapanlagi.com/. Kata Kunci : focused crawler, web olahraga, naïve bayes, Learning Anchor Algorithm.
Rekomendasi Pengambilan Mata Kuliah Pilihan Menggunakan Recursive Elimination Algorithm (Relim) Satrio Prasojo; Shaufiah Shaufiah; Hetti Hidayati
eProceedings of Engineering Vol 2, No 1 (2015): April, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Pada proses perkuliahan, setiap mahasiswa pada proses registrasi wajib melakukan tahapan perwalian. Mahasiswa biasanya mengajukan mata kuliah apa saja yang akan diambilnya kepada dosen wali, setelah itu dosen wali akan memberikan saran terkait mata kuliah apa saja yang sebaiknya diambil, terutama mata kuliah pilihan. Demi memudahkan proses tersebut, dibuatlah sebuah sistem yang menangani perekomendasian. Sistem ini memanfaatkan teknik data mining menggunakan algoritma Recursive Elimination (Relim). Data yang diproses akan dipadatkan menggunakan parameter minimum support. Implementasi yang dilakukan terbukti dapat menghasilkan rekomendasi mata kuliah pilihan dengan aturan asosiasi yang menggunakan nilai support dan confidence sebagai acuannya. Kata kunci : rekomendasi, Relim, minimum support, support, confidence
Sentiment Analysis Berbahasa Indonesia Menggunakan Improved Multinomial Naive Bayes Muhammad Adib Imtiyazi; Shaufiah Shaufiah; Moch. Arif Bijaksana
eProceedings of Engineering Vol 2, No 2 (2015): Agustus, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

ABSTRAKSI Penggunaan Multinomial Naïve Bayes sebagai classifier dalam kasus sentiment analysis sudah jamak dilakukan, namun penggunaan TF-IDF sebagai feature weighting dalam kasus tersebut dirasa kurang sesuai karena pada kasus sentiment analysis, karena sifat dari TF-IDF itu sendiri yang lebih mementingkan frequency kemunculan kata. Oleh karena itu, digunakanlah algoritma Improved Multinomial Naïve Bayes yang menggunakan Improved Gini Index (TF- iGini) dalam pembobotan yang dianggap lebih tepat sehingga dapat menghasilkan performansi yang lebih baik. Pada tugas akhir ini dilakukan perbandingan performansi dari Multinomial Naïve Bayes + TF-IDF dan Multinomial Naïve Bayes + TF-iGini. Hasil percobaan menunjukkan bahwa iGini mampu memberikan hasil yang cukup baik jika dibandingankan dengan IDF pada Multinomial Naïve Bayes, namun tidak cukup baik untuk menggantikan fungsi IDF dalam kasus klasifikasi sentiment. Kata kunci: sentiment analysis, feature weighting, IDF, improved gini, Multinomial Naïve Bayes, Bahasa Indonesia.
Analisis Algoritma Rp-gd Dalam Kualitas Peringkasan Graf Dari Basisdata Graf Defrianda Rizky Pranata; Kemas Rahmat Saleh Wibowo; Shaufiah Shaufiah
eProceedings of Engineering Vol 2, No 2 (2015): Agustus, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak Basisdata graf merupakan representasi dari pemodelan suatu koleksi data ke dalam bentuk Node dan Edge. Basisdata Graf juga merupakan sebuah bentuk atau model dari database yang menyediakan solusi efektif dan efisien terhadap penyimpanan data . Dikembangkan di era bigdata seperti sekarang ini merupakan terobosan baru di bidang Computer Science khususnya Data Engineering. Terdiri dari Edges, Nodes, dan Properties yang digunakan untuk merepresentasikan dan menyimpan data. Bersifat index-free adjacency yang berarti bahwa setiap elemen berisi pointer langsung ke elemen yang berdekatan dan tidak ada pencarian indeks diperlukan. Database grafik umum yang dapat menyimpan grafik pun berbeda dari database grafik khusus seperti triplestores dan database jaringan. Ketika hanya menggunakan model database yang berbentuk relational database tentunya semakin lama semakin kesulitan karena datanya disini sangatlah banyak sekali. Disinilah penulis akan menggunakan model database yang masih tergolong baru, yaitu Graph Database. Model ini dapat merepresentasikan banyak data dalam suatu graf yang bisa dianalisis serta diambil kesimpulannya dari banyak simpul serta busur yang penulis peroleh dari dataset molekuler ikatan kimia. Dengan menggunakan model ini, tentunya dapat dilihat ringkasan molekuler yang dapat dilihat dari analisa dan peringkasan basisdata graf yang penulis ambil sebagai topik dari penulisan karya ini. Metode peringkasan yang penulis ambil adalah RP-GD Algorithm yang penulis gunakan mempunyai efisiensi dan kualitas yang dapat meringkas suatu basisdata graf. Diharapkan algoritma tersebut bisa meningkatkan kualitas dari sebuah graph database sehingga peringkasan dari model tersebut mempunyai hasil yang maksimal dalam merepresentasikan molekuler ikatan kimia dari dataset tersebut. Dari hasil pengujian dan analisis, maka terbukti bahwa algoritma RP-GD dapat digunakan dalam peringkasan basisdata graf, serta menghasilkan kualitas yang baik dalam pemrosesan maupun hasilnya. Dilihat dari jumlah nodes dan edges hasil peringkasan lalu cakupan informasi dan rasio peringkasan menjadi parameter yang menunjukkan hasil tersebut. Variasi hasil peringkasan juga dapat dilakukan sesuai dengan minimum support yang diinginkan. Nilai cakupan informasi dari sebuah ringkasan basisdata graf berbanding lurus dengan nilai minimum support yang diberikan, sedangkan rasio peringkasan berbanding terbalik dengan nilai minimum support yang diberikan. Kata Kunci : Graph Database, RP-GD Algorithm, dataset SMILES, summarization graph, summariation quality, chemical compounds, chemical informatics
Implementasi Metode Entropy Dan Oreste Pada Rekruitasi Karyawan Ludwika Hermawan; Mahmud Imrona; Shaufiah Shaufiah
eProceedings of Engineering Vol 1, No 1 (2014): Desember, 2014
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Rekruitasi karyawan adalah salah satu proses penting dalam kegiatan sebuah perusahaan. Suatu pekerjaan tertentu membutuhkan kualifikasi tertentu bagi setiap karyawan yang akan bekerja dalam bidang tersebut. Calon karyawan juga memiliki kriteria khusus dan kualifikasi khusus yang dibutuhkan dalam bidang tertentu agar kualitas perusahaan tetap terjaga dan diharapkan bisa meningkat. Dalam proses rekruitasi di perusahaan terdapat sistem yang digunakan untuk membantu dan merekomendasikan proses pemilihan karyawan yang tepat untuk bidang pekerjaan yang tepat. Sistem tersebut melakukan pengolahan data (nilai) untuk memilih karyawan. Metode yang digunakan pada sistem ini adalah entropy dan oreste. Metode entropy digunakan dalam pembobotan dan penentuan tingkat kepentingan kriteria karena entropy sesuai digunakan untuk data yang memiliki variasi tinggi. Metode oreste digunakan dalam perankingan karena metode oreste adalah metode yang menitkberatkan bahwa kriteria yang terbaik adalah yang memiliki banyak keunggulan dalam banyak kriteria. Selain itu metode oreste menggunakan data dalam bentuk ordinal dimana dalam rekruitasi ini sebagian sub kriteria umum dan kriteria khusus menggunakan penilaian dalam bentuk ordinal. Dalam kasus ini proses rekruitasi karyawan menggunakan data sebanyak 294 calon karyawan dari 5 periode rekruitasi yang terbagi dalam 4 bidang pekerjaan yang diambil dari perusahaan Clarisense Digital Media. Dari 294 calon karyawan terpilih 45 karyawan. Pengujian aplikasi rekruitasi karyawan menggunakan metode entropy dan oreste terhadap data 5 periode rekruitasi didapatkan tingkat kecocokan rata-rata untuk setiap bidang pekerjaan per periode rekruitasi sebesar 81.75%. Kata Kunci : rekruitasi karyawan, entropy, oreste, pembobotan, perankingan
Analisis Dan Implementasi Algoritma Overlapping Cover Coefficient-based Clustering Method (oc3m) Pada Dokumen Teks Berbahasa Indonesia Gusti Ngurah Diva Adwitya; Shaufiah Shaufiah; Veronikha Effendy
eProceedings of Engineering Vol 2, No 2 (2015): Agustus, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak Dengan bertambah pesatnya informasi/dokumen yang beredar di internet sehingga memungkinkan untuk suatu dokumen dapat dikelompokkan ke dalam dua atau lebih kategori sekaligus. Oleh karena itu dibutuhkan suatu metode untuk mengelompokkan dokumen-dokumen tersebut ke dalam dua atau lebih kategori sekaligus. Overlapping Cover Coefficient Clustering Method (OC3M) adalah suatu metode pengelompokan dokumen dengan model probabilitik, kesamaan term, dan seed dokumen sebagai inisialisasi awal dari pembentukan cluster. Pada metode ini diterapkan sifat overlap, yaitu kondisi dimana dokumen dapat menempati lebih dari satu cluster. Pengujian yang dilakukan pada tugas akhir ini dalam mengelompokkan dokumen dengan algoritma OC3M yaitu menganalisis cluster yang dihasilkan berdasarkan nilai Silhouette Coefficient-nya serta menganalisis hal-hal yang mempengaruhi kualitas cluster yang terbentuk. Kualitas cluster yang terbentuk dipengaruhi oleh banyaknya dokumen yang digunakan, tipe dokumen, kemiripan dokumen dengan pusat cluster, dan juga dipengaruhi oleh overlapping coefficient yaitu parameter yang menentukan banyaknya suatu dokumen yang similar dapat dikelompokkan ke dalam cluster yang berbeda. Dari hasil percobaan, kualitas cluster yang terbentuk dengan menggunakan algoritma OC3M memiliki kualitas yang cukup baik, ini di tunjukkan dengan nilai silhouette coefficient yang bernilai positif. Kata kunci : OC3M, Overlap, Overlaping, Clustering, Cluster
Filtering Sms Spam Berdasarkan Naive Bayes Classifier Dan Apriori Algorithm Frequent Itemset Fahrizal Masyhur Fahrizal Masyhur; Shaufiah Shaufiah; Moc. Arif Bijaksana
eProceedings of Engineering Vol 2, No 3 (2015): Desember, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

SMS masih menjadi salah satu pelayanan terpenting dalam media komunikasi. Namun karena SMS murah dan banyak digunakan, maka banyak muncul SMS spam. Untuk menanggulanginya, dalam tugas akhir ini penulis menggunakan Naive Bayes Classifier dan Apriori Algorithm Frequent Itemset. Penulis memilih Naive Bayes Classifier dikarenakan Naive Bayes Classifier dianggap sebagai salah satu algoritma learning yang efektif. Sedangkan Apriori Algorithm Frequent Itemset merupakan algoritma yang cocok untuk menanggulangi data dan transaksi yang banyak. Dalam kasus klasifikasi SMS spam menggunakan Naive Bayes Classifier, setiap kata yang di anggap sebagai data dan setiap sms dianggap transaksi. Hasilnya, dengan menggabungkan Apriori Algorithm Frequent Itemset pada Naive Bayes Classifier, terdapat peningkatan daripada menggunakan klasik Naive Bayes Classifier pada data SMS Corpus v.0.1 Big. Akurasi rata-rata Naive Bayes Classifier sebesar 97.22 sedangkan akurasi rata-rata Naive Bayes Classifier dan Apriori Algorithm Frequent Itemset mengalami peningkatan menjadi 97.33 Kata Kunci: SMS, Naive Bayes classifier, Apriori frequent itemset, spam
Filtering Sms Spam Menggunakan Metode Artificial Immune System (ais) Dan Algoritma Tokenization With Vectors Vero Arneal Octora; Moc. Arif Bijaksana; shaufiah shaufiah
eProceedings of Engineering Vol 2, No 3 (2015): Desember, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

SMS merupakan layanan penting yang terdapat pada perangkat mobile disamping layanan panggilan suara. SMS Spam merupakan masalah yang sangat serius bagi hampir semua pengguna layanan SMS. Untuk mengatasi masalah spam ini dapat digunakan teknik klasifikasi yang dapat membedakan antara SMS spam dan ham (bukan spam) ketika suatu SMS masuk ke dalam perangkat mobile pengguna. Metode yang digunakan pada penelitian ini adalah metode Artificial Immune System (AIS) yang dikombinasikan dengan algoritma Tokenization With Vectors yang berfungsi sebagai preprocessing teks sebelum teks tersebut diklasifikasikan dengan metode AIS. Dari hasil ekperimen yang telah dilakukan, didapatkan hasil bahwa untuk pengujian cross validation 5-fold memiliki akurasi sebesar 89.26% pada penerapan metode AIS yang menambahkan algoritma Tokenization With Vectors dan 89.06% untuk metode AIS yang tidak menambahkan algoritma Tokenization With Vectors. Sedangkan Untuk pengujian cross validation dengan 10 - fold memiliki akurasi sebesar 81.92% untuk penerapan metode AIS yang menambahkan algoritma Tokenization With Vectors dan 81.24% untuk metode AIS yang tidak menambahkan algoritma Tokenization With Vectors. Penggunaan algoritma Tokenization With Vectors memiliki rata-rata akurasi yang lebih tinggi daripada yang tidak menggunakan algoritma tersebut, tetapi selisih hasil rata-rata akurasi yang didapatkan tidak terlalu banyak. Kata kunci : Short Message Service, Artificial Immune System, filtering, spam, ham, Tokenization With Vectors
Association Rule Mining with IST-EFP Algorithm The Novelty of FP-Growth Algorithm Boby Siswanto; The Liong; Shaufiah Shaufiah
eProceedings of Engineering Vol 1, No 1 (2014): Desember, 2014
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

EFP algorithm is an FP-Growth algorithm that is applied to the DBMS such as Oracle DBMS. IST-EFP algorithm is the improvement of EFP algorithm which is combined by intersection of set theory analysis. IST-EFP algorithm will reduce items from the original dataset that have low support value. ISTEFP algorithm has better performance than EFP algorithm because it reduces more items while maintaining the confidence values of the association rules obtained. Keywords—EFP algorithm; IST-EFP algorithm; Oracle DBMS; item reductions; maintain confidence values; association rules.