Claim Missing Document
Check
Articles

Found 26 Documents
Search
Journal : eProceedings of Engineering

Analisis Dan Implementasi Algoritma Overlapping Cover Coefficient-based Clustering Method (oc3m) Pada Dokumen Teks Berbahasa Indonesia Gusti Ngurah Diva Adwitya; Shaufiah Shaufiah; Veronikha Effendy
eProceedings of Engineering Vol 2, No 2 (2015): Agustus, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak Dengan bertambah pesatnya informasi/dokumen yang beredar di internet sehingga memungkinkan untuk suatu dokumen dapat dikelompokkan ke dalam dua atau lebih kategori sekaligus. Oleh karena itu dibutuhkan suatu metode untuk mengelompokkan dokumen-dokumen tersebut ke dalam dua atau lebih kategori sekaligus. Overlapping Cover Coefficient Clustering Method (OC3M) adalah suatu metode pengelompokan dokumen dengan model probabilitik, kesamaan term, dan seed dokumen sebagai inisialisasi awal dari pembentukan cluster. Pada metode ini diterapkan sifat overlap, yaitu kondisi dimana dokumen dapat menempati lebih dari satu cluster. Pengujian yang dilakukan pada tugas akhir ini dalam mengelompokkan dokumen dengan algoritma OC3M yaitu menganalisis cluster yang dihasilkan berdasarkan nilai Silhouette Coefficient-nya serta menganalisis hal-hal yang mempengaruhi kualitas cluster yang terbentuk. Kualitas cluster yang terbentuk dipengaruhi oleh banyaknya dokumen yang digunakan, tipe dokumen, kemiripan dokumen dengan pusat cluster, dan juga dipengaruhi oleh overlapping coefficient yaitu parameter yang menentukan banyaknya suatu dokumen yang similar dapat dikelompokkan ke dalam cluster yang berbeda. Dari hasil percobaan, kualitas cluster yang terbentuk dengan menggunakan algoritma OC3M memiliki kualitas yang cukup baik, ini di tunjukkan dengan nilai silhouette coefficient yang bernilai positif. Kata kunci : OC3M, Overlap, Overlaping, Clustering, Cluster
Filtering Sms Spam Berdasarkan Naive Bayes Classifier Dan Apriori Algorithm Frequent Itemset Fahrizal Masyhur Fahrizal Masyhur; Shaufiah Shaufiah; Moc. Arif Bijaksana
eProceedings of Engineering Vol 2, No 3 (2015): Desember, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

SMS masih menjadi salah satu pelayanan terpenting dalam media komunikasi. Namun karena SMS murah dan banyak digunakan, maka banyak muncul SMS spam. Untuk menanggulanginya, dalam tugas akhir ini penulis menggunakan Naive Bayes Classifier dan Apriori Algorithm Frequent Itemset. Penulis memilih Naive Bayes Classifier dikarenakan Naive Bayes Classifier dianggap sebagai salah satu algoritma learning yang efektif. Sedangkan Apriori Algorithm Frequent Itemset merupakan algoritma yang cocok untuk menanggulangi data dan transaksi yang banyak. Dalam kasus klasifikasi SMS spam menggunakan Naive Bayes Classifier, setiap kata yang di anggap sebagai data dan setiap sms dianggap transaksi. Hasilnya, dengan menggabungkan Apriori Algorithm Frequent Itemset pada Naive Bayes Classifier, terdapat peningkatan daripada menggunakan klasik Naive Bayes Classifier pada data SMS Corpus v.0.1 Big. Akurasi rata-rata Naive Bayes Classifier sebesar 97.22 sedangkan akurasi rata-rata Naive Bayes Classifier dan Apriori Algorithm Frequent Itemset mengalami peningkatan menjadi 97.33 Kata Kunci: SMS, Naive Bayes classifier, Apriori frequent itemset, spam
Filtering Sms Spam Menggunakan Metode Artificial Immune System (ais) Dan Algoritma Tokenization With Vectors Vero Arneal Octora; Moc. Arif Bijaksana; shaufiah shaufiah
eProceedings of Engineering Vol 2, No 3 (2015): Desember, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

SMS merupakan layanan penting yang terdapat pada perangkat mobile disamping layanan panggilan suara. SMS Spam merupakan masalah yang sangat serius bagi hampir semua pengguna layanan SMS. Untuk mengatasi masalah spam ini dapat digunakan teknik klasifikasi yang dapat membedakan antara SMS spam dan ham (bukan spam) ketika suatu SMS masuk ke dalam perangkat mobile pengguna. Metode yang digunakan pada penelitian ini adalah metode Artificial Immune System (AIS) yang dikombinasikan dengan algoritma Tokenization With Vectors yang berfungsi sebagai preprocessing teks sebelum teks tersebut diklasifikasikan dengan metode AIS. Dari hasil ekperimen yang telah dilakukan, didapatkan hasil bahwa untuk pengujian cross validation 5-fold memiliki akurasi sebesar 89.26% pada penerapan metode AIS yang menambahkan algoritma Tokenization With Vectors dan 89.06% untuk metode AIS yang tidak menambahkan algoritma Tokenization With Vectors. Sedangkan Untuk pengujian cross validation dengan 10 - fold memiliki akurasi sebesar 81.92% untuk penerapan metode AIS yang menambahkan algoritma Tokenization With Vectors dan 81.24% untuk metode AIS yang tidak menambahkan algoritma Tokenization With Vectors. Penggunaan algoritma Tokenization With Vectors memiliki rata-rata akurasi yang lebih tinggi daripada yang tidak menggunakan algoritma tersebut, tetapi selisih hasil rata-rata akurasi yang didapatkan tidak terlalu banyak. Kata kunci : Short Message Service, Artificial Immune System, filtering, spam, ham, Tokenization With Vectors
Association Rule Mining with IST-EFP Algorithm The Novelty of FP-Growth Algorithm Boby Siswanto; The Liong; Shaufiah Shaufiah
eProceedings of Engineering Vol 1, No 1 (2014): Desember, 2014
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

EFP algorithm is an FP-Growth algorithm that is applied to the DBMS such as Oracle DBMS. IST-EFP algorithm is the improvement of EFP algorithm which is combined by intersection of set theory analysis. IST-EFP algorithm will reduce items from the original dataset that have low support value. ISTEFP algorithm has better performance than EFP algorithm because it reduces more items while maintaining the confidence values of the association rules obtained. Keywords—EFP algorithm; IST-EFP algorithm; Oracle DBMS; item reductions; maintain confidence values; association rules.
Sms Classification Deteksi Spam Dengan Menggunakan Algoritma Artificial Immune System Dan Apriori Frequent Itemset Firizqy Ramadhana Nasution; Shaufiah Shaufiah; Moc. Arif Bijaksana
eProceedings of Engineering Vol 2, No 3 (2015): Desember, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Saat ini mobile Phone sudah menjadi salah satu kebutuhan penting masyarakat dan salah satu fiture yang sangat di andalkan pada mobile phone adalah short message service (SMS). SMS saat berguna untuk menyampaikan suatu pesan singkat padat jelas serta hemat biaya pemakaian, data yang disampaikan pun berupa text sehingga data bisa di simpan dan di gunakan untuk keperluan lain. Tetapi dalam kasus yang sama, terjadi penurunan harga dari SMS, hal ini memicu meningkatnya unsolicited commercial advertisements (Spam). Spam sangat mengguntungkan bagi pengirim pesan namun saat mengganggu bagi penerima pesan dikarenakan pesan yang di terima bersifat memaksa dengan output yang sangat besar, peningkatan SMS spam sangat signifikan, pada tahun 2013 di region Asia SMS spam meningkat sebesar 30%. Pada penelitian tugas akhir ini dilakukan analisis dan implementasi Spam detection untuk melakukan filtering pada SMS spam dengan algoritma Artificial Immune System(AIS), sebuah algoritma pengelompokan yang memakai ide dari sistem kekebalan tubuh manusia dengan tamabahan algoritma apriori untuk menghasilkan frequent itemset. Sebagai hasilnya algoritma Artificial Immune System dapat meningkatkan performansi dari sistem sms filtering sebesar 5% dan nilai akurasi dari sistem di atas angka 95%, karena seperti kekebalan tubuh manusia sistem dapat membuat antibody baru yang dapat menanggulangi masalah sms spam dan penggabungan dari kombinasi baru data set yang dihasilkan frequent itemset menambah nilai dari performa sistem. Kata kunci : sms,spam , Artificial Immune System, apriori
Sms Filtering Menggunakan Naive Bayes Classifier Dan Fp-growth Algorithm Frequent Itemset Dea Delvia Arifin; Shaufiah Shaufiah; Moch. Arif Bijaksana
eProceedings of Engineering Vol 2, No 2 (2015): Agustus, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak SMS (Short Message Service) masih menjadi pilihan utama sebagai media komunikasi walaupun sekarang ponsel semakin berkembang dengan berbagai media komunikasi aplikasi messenger. Seiring dengan berkembangnya berbagai media komunikasi lain, beberapa operator di beberapa negara menurunkan tarif SMS untuk tetap menarik minat pengguna ponsel. Namun penurunan tarif ini menyebabkan meningkatnya SMS spam, karena dimanfaatkan oleh beberapa pihak sebagai salah satu alternatif untuk iklan hingga penipuan. Hal itu menjadi permasalahan penting karena dapat mengganggu dan merugikan pengguna. Naive Bayes dianggap sebagai salah satu learning algorithm yang sangat efektif dan penting untuk machine learning dalam information retrieval. Naive Bayes terbukti memiliki kinerja yang baik dalam klasifikasi teks dan deteksi SMS spam [2,10] dengan menunjukan akurasi yang tinggi. Dengan dikolaborasikan algoritma yang mampu menentukan frequent itemset dengan baik maka mampu menghasilkan tingkat akurasi yang lebih baik [2]. Karena tidak hanya setiap kata yang dianggap mutually independent, tetapi juga kata yang frequent sebagai kata yang single, independent dan mutually exclusive [2], sehingga mampu meningkatkan nilai peluang dan menyebabkan sistem lebih tepat dalam klasifikasi. Dalam hal ini digunakan FP-Growth untuk mining frequent pattern yang memiliki performansi yang baik dan efisien karena tidak membutuhkan pembangkitan kandidat frequent [4]. Hasil penelitian penggunan kolaborasi antara Naive Bayes dan FP-Growth menghasilkan akurasi rata- rata terbesar sebesar 98, 506% dan lebih unggul 0,025% dari metode tanpa melibatkan FP-Growth untuk dataset SMS Spam Collection v.1, serta meningkatkan nilai precision sehingga hasil klasifikasi lebih akurat. Kata Kunci: ekstraksi kata kunci, KEA, social media
Analisis Dan Implementasi Algoritma Graph-basedk-nearest Neighbour Untuk Klasifikasi Spam Pada Pesan Singkat Gde Surya Pramartha; Shaufiah Shaufiah; Moch. Arif Bijaksana
eProceedings of Engineering Vol 2, No 2 (2015): Agustus, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak : Pesan singkat atau Short Message Service (SMS) adalah salah satu layanan komunikasi yang sangat populer pada mobile phone saat ini karena kemudahan penggunaan, sederhana, cepat, dan murah. Meningkatnya penggunaan mobile phone ini dimanfaatkan oleh banyak pihak untuk mendapatkan keuntungan, salah satunya adalah mengirimkan spam melalui SMS. Spam biasanya berisikan iklan dari suatu produk, promosi, atau malware yang sangat mengganggu pengguna mobile phone. Oleh sebab itu, dalam tugas akhir ini dibuatlah SMS spam filter untuk menyaring SMS yang menggunakan algoritma Graph-based K- Nearest Neighbour (GKNN). SMS yang didapatkan terlebih dahulu di preprocessing kemudian data akan direpresentasikan ke dalam model graf berbobot dan berarah. Pengujian algoritma dilakukan dengan menggunakan skenario pembagian data 5-fold dan 10-fold dan didapatkan hasil dengan rata-rata akurasi mencapai 99,06% untuk 5-fold dan 99,13% untuk 10-fold. Kata Kunci : spam, spam filtering, preprocessing, klasifikasi, k-nearest neighbour, graph- based k-nearest neighbour
Feature-based Opinion Menggunakan Algoritma High Adjective Count Dan Max Opinion Score ( Studi Kasus Review Di Google Play). Eri Angga Pradana; Shaufiah Shaufiah; Nungki Selviandro
eProceedings of Engineering Vol 2, No 3 (2015): Desember, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Banyaknya jumlah aplikasi pada Google Play terkadang terjadi ketidak sesuaian aplikasi yang dibeli tidak sesuai dengan kebutuhan, hal tersebut terjadi dikarenakan sulitnya menemukan informasi terkait kelebihan dan keunggulan fitur aplikasi pada google playstore. Pemanfaatan review diharapkan dapat memberikan informasi terkait kelebihan dan kekurangan fitur pada pengguna dengan mengekstrak fitur berdasarkan opini yang terdapat dalam review. Opini yang didapatkan akan menjadi penilaian pada fitur. Untuk mendapatkan nilai fitur diperlukan beberapa tahapan proses dari pengumpulan data review, data review adalah file .html hasilpenyimpanan website aplikasi google dengan cara manual. Data yang sudah terkumpul akan di proses beberapa tahap antara lain tahap preprocessing, tahap ekstraksi fitur dengan algoritma High Adjective Count(HAC) dan tahap penilaian fitur dengan algoritma Max Opinion Score(MOS). Untuk validasi kebenaran fitur penulis menggunakan pelabelan fitur secara manual menggunakan responden. Hasil yang didapatkan diketahui HAC memiliki akurasi 80% untuk ekstraksi fitur pada top 5 fitur yang dihasilkan dari keseluruhan review. HAC memiliki akurasi 28.78% nilai ekstraksi fitur dalam satu review atau single review. Hasil yang diberikan pada MOS dapat memberikan fitur beserta nilai fitur. Kata kunci : feature based, opini, high adjective count, max opinion score, review, googleplay
Evaluasi Model Navigasi Pada Online Assessment Test Menggunakan Process Mining (Studi Kasus: The British English Course) Selvia Yulvairariany; Imelda Atastina; Shaufiah Shaufiah
eProceedings of Engineering Vol 1, No 1 (2014): Desember, 2014
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Online Assessment Test atau seringkali disebut Online Test sekarang ini sering digunakan dalam proses belajar mengajar untuk mengevaluasi kinerja peserta tes dengan lebih mudah secara online. Jenis soal pada online test biasanya adalah Pilihan ganda atau Multiple-Choice Questions (MCQ) sehingga merupakan hal yang penting untuk mempertimbangkan pola pengerjaan soal agar hasil dari online test tersebut benar-benar menunjukan kemampuan peserta dalam memahami materi yang telah dipelajari dalam proses pembelajaran. Pada tugas akhir ini, dilakukan process mining yaitu Process Discovery yang digunakan untuk mengetahui model navigasi, bagaimana cara peserta tes menjawab pertanyaan online test, sehingga dapat mengetahui bagaimana model tersebut berpengaruh terhadap kinerja peserta tes. Process mining dilakukan menggunakan salah satu algoritma Process Discovery yaitu Fuzzy miner dengan framework ProM. Data yang digunakan adalah event log proses online test tersebut dan analisis dilakukan terhadap alur proses yang terjadi dalam pengerjaan online test. Dengan demikian diketahui model navigasi berpengaruh terhadap kinerja peserta tes. Kata kunci: Online Assessment Test, Online Test, Multiple-Choice Questions (MCQ), Process Mining, Process discovery, Fuzzy Miner, ProM, Event Log.
Implementasi Dan Analisis Klasifikasi Spam Pada Pesan Singkat Seluler Dengan Pendekatancollaborative Filtering Menggunakan Naïve Bayes Ricky Kristian Butar Butar; Moc. Arif Bijaksana; Shaufiah Shaufiah
eProceedings of Engineering Vol 2, No 3 (2015): Desember, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Pesan Singkat atau yang dikenal dengan SMS (Short Message Service) merupakan layanan pertukaran pesan antar pengguna layanan tersebut. Semakin banyaknya pengguna layanan SMS, tidak sedikit pihak yang memanfaatkannya untuk mendapatkan keuntungan, yaitu dengan menyebarkan SMS sampah, atau dikenal dengan SMS spam. Oleh karena itu, pada penelitian tugas akhir ini, penulis melakukan pengklasifikasian terhadap SMS yaitu kelas spam maupun ham. Pengklasifikasian SMS tersebut dengan menggunakan pendekatan Collaborative Naïve Bayes yang berorientasi pada rekomendasi beberapa pengguna dan Content-Based Naïve Bayes dengan melihat konten pada SMS. Data rekomendasi didapatkan dengan menyebarkan 300 SMS kepada pengguna. Untuk Content-Based dibutuhkan preprocessing sehingga konten SMS menjadi seragam, memiliki informasi penting, dan mempercepat proses komputasi. Preprocessing yang digunakan adalah slang handling, stopword removal, dan stemming. Pengujian dilakukan dengan membagi SMS menjadi data latih dan data uji sesuai dengan pembagian data cross validation yaitu 5-fold dan 10-fold. Hasil pengujian yang dilakukan menghasilkan tingkat akurasi sebesar 97.12% untuk 5-fold dan 97.28% untuk 10-fold sehingga dikatakan mampu meningkatkan keakurasian pengklasifikasian SMS dengan menggunakan metode Collaborative Filtering. Kata Kunci : Pengklasifikasian, Collaborative, Content-Based, Naïve Bayes, Preprocessing