Claim Missing Document
Check
Articles

Found 10 Documents
Search

Implementasi Dan Analisis Pengukuran Semantic Relatedness Menggunakan Random Walks Berbasis Wordnet Muhammad Kenzi; Moc. Arif Bijaksana; Adiwijaya Adiwijaya
eProceedings of Engineering Vol 2, No 3 (2015): Desember, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Pengukuran semantic relatedness merupakan suatu pekerjaan untuk memperkirakan kedekatan arti dari pasangan kata. Pekerjaan ini dengan mudah bisa dilakukan oleh manusia berdasarkan pengalaman dan wawasannya, namun komputer hanya bisa melakukannya dengan mengukur nilai keterkaitannya dengan bantuan pemahaman arti kata seperti kamus, tesaurus, dan ensiklopedia. Salah satu contoh bantuannya yang sering dipakai pada pekerjaan ini yaitu WordNet yang akan digunakan pada pengerjaan tugas akhir ini. Pekerjaan ini akan mempermudah pekerjaan Natural Language Processing, seperti pendeteksi plagiarisme antara dua data teks yang berbeda. Pada tugas akhir ini pengukuran semantic relatedness dilakukan pada sebuah model graph yang dibangun dengan bantuan WordNet. Setiap kata dan arti-artinya di dalam WordNet akan dijadikan sekumpulan node yang saling terhubung melalui beberapa tipe edge berdasarkan suatu relasi yang menghubungkannya. Tiap tipe edge tersebut memiliki cara pembobotan yang berbeda-beda. Pembobotan tersebut akan mempengaruhi hasil dari pengukuran semantic relatedness.Graph yang telah dibangun tersebut adalah untuk menjalankan metode pengukuran semantic relatedness yang dinamakan random walks. Graph akan menjadi tempat berjalannya partikel yang berasal dari random walks. Partikel tersebut akan berjalan dari node ke node lainnya yang terhubung berdasarkan probabilitas berpindahnya. Probabilitas kepindahannya tersebut hanya dipengaruhi oleh node yang sedang disinggahi partikel, hal ini lah yang membuat random walk ini disebut sebagai Markov chain. Hasil dari semantic relatedness melalui sistem yang dibuat dengan menggunakan dataset Rubenstein dan Goodenough mendapatkan hasil evaluasi menggunakan Pearson correlation coefficient dengan nilai tertinggi 0.477. Kata kunci: semantic relatedness, WordNet, Natural Language Processing, random walks, graph, Markov chain, Pearson correlation coefficient
Analisis Dan Implementasi Short Text Similarity Dengan Metode Latent Semantic Analysis Untuk Mengetahui Kesamaan Ayat Al-quran Mochamad Irfan Dary; Moc. Arif Bijaksana; Siti Sa'adah
eProceedings of Engineering Vol 2, No 3 (2015): Desember, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Salah satu cara untuk membantu memahami sebuah konsep adalah dengan mencari hubungan antara konsep tersebut dengan konsep yang lainnya. Latent semantic analysis (LSA) adalah salah satu penerapan dari hal tersebut. Dimana  LSA dapat mencari nilai kesamaan antar konsep. LSA adalah suatu cara untuk mengekstraksi tulisan dan membuat representasi statistik dari tulisan tersebut dengan pendekatan dimensi rendah (low rank approximation), dimana digunakan dimensi yang kecil untuk mengetahui keseluruhan makna dokumen. Tetapi salah satu kekurangan LSA adalah tidak ada cara yang pasti untuk mengetahui berapa dimensi yang harus digunakan dan bagaimana signifikansi dari penggunaannya pada short text seperti ayat al-Quran. Dari hasil pengujian didapat bahwa dari berbagai dimensi yang digunakan, akurasi maksimum adalah 71% dan F-measure terbaik adalah 40%. Lebih baik dibandingkan term document matrix biasa (tanpa LSA) dengan akurasi 85% tetapi F-measure 0%. Temuan lainnya adalah jika dimensi yang dipilih terlalu rendah, maka nilainya semakin seragam dan bias sehingga nilainya kurang relevan. Selain itu ada dimensi keseimbangan, dimana dimulai dari dimensi tersebut, hasil similarity tidak akan terlalu jauh berbeda.  Kata Kunci: latent semantic analysis, similarity, al-Quran, clustering, matriks, singular value decomposition, cosine similarity
Filtering Sms Spam Berdasarkan Naive Bayes Classifier Dan Apriori Algorithm Frequent Itemset Fahrizal Masyhur Fahrizal Masyhur; Shaufiah Shaufiah; Moc. Arif Bijaksana
eProceedings of Engineering Vol 2, No 3 (2015): Desember, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

SMS masih menjadi salah satu pelayanan terpenting dalam media komunikasi. Namun karena SMS murah dan banyak digunakan, maka banyak muncul SMS spam. Untuk menanggulanginya, dalam tugas akhir ini penulis menggunakan Naive Bayes Classifier dan Apriori Algorithm Frequent Itemset. Penulis memilih Naive Bayes Classifier dikarenakan Naive Bayes Classifier dianggap sebagai salah satu algoritma learning yang efektif. Sedangkan Apriori Algorithm Frequent Itemset merupakan algoritma yang cocok untuk menanggulangi data dan transaksi yang banyak. Dalam kasus klasifikasi SMS spam menggunakan Naive Bayes Classifier, setiap kata yang di anggap sebagai data dan setiap sms dianggap transaksi. Hasilnya, dengan menggabungkan Apriori Algorithm Frequent Itemset pada Naive Bayes Classifier, terdapat peningkatan daripada menggunakan klasik Naive Bayes Classifier pada data SMS Corpus v.0.1 Big. Akurasi rata-rata Naive Bayes Classifier sebesar 97.22 sedangkan akurasi rata-rata Naive Bayes Classifier dan Apriori Algorithm Frequent Itemset mengalami peningkatan menjadi 97.33 Kata Kunci: SMS, Naive Bayes classifier, Apriori frequent itemset, spam
Filtering Sms Spam Menggunakan Metode Artificial Immune System (ais) Dan Algoritma Tokenization With Vectors Vero Arneal Octora; Moc. Arif Bijaksana; shaufiah shaufiah
eProceedings of Engineering Vol 2, No 3 (2015): Desember, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

SMS merupakan layanan penting yang terdapat pada perangkat mobile disamping layanan panggilan suara. SMS Spam merupakan masalah yang sangat serius bagi hampir semua pengguna layanan SMS. Untuk mengatasi masalah spam ini dapat digunakan teknik klasifikasi yang dapat membedakan antara SMS spam dan ham (bukan spam) ketika suatu SMS masuk ke dalam perangkat mobile pengguna. Metode yang digunakan pada penelitian ini adalah metode Artificial Immune System (AIS) yang dikombinasikan dengan algoritma Tokenization With Vectors yang berfungsi sebagai preprocessing teks sebelum teks tersebut diklasifikasikan dengan metode AIS. Dari hasil ekperimen yang telah dilakukan, didapatkan hasil bahwa untuk pengujian cross validation 5-fold memiliki akurasi sebesar 89.26% pada penerapan metode AIS yang menambahkan algoritma Tokenization With Vectors dan 89.06% untuk metode AIS yang tidak menambahkan algoritma Tokenization With Vectors. Sedangkan Untuk pengujian cross validation dengan 10 - fold memiliki akurasi sebesar 81.92% untuk penerapan metode AIS yang menambahkan algoritma Tokenization With Vectors dan 81.24% untuk metode AIS yang tidak menambahkan algoritma Tokenization With Vectors. Penggunaan algoritma Tokenization With Vectors memiliki rata-rata akurasi yang lebih tinggi daripada yang tidak menggunakan algoritma tersebut, tetapi selisih hasil rata-rata akurasi yang didapatkan tidak terlalu banyak. Kata kunci : Short Message Service, Artificial Immune System, filtering, spam, ham, Tokenization With Vectors
Sms Classification Deteksi Spam Dengan Menggunakan Algoritma Artificial Immune System Dan Apriori Frequent Itemset Firizqy Ramadhana Nasution; Shaufiah Shaufiah; Moc. Arif Bijaksana
eProceedings of Engineering Vol 2, No 3 (2015): Desember, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Saat ini mobile Phone sudah menjadi salah satu kebutuhan penting masyarakat dan salah satu fiture yang sangat di andalkan pada mobile phone adalah short message service (SMS). SMS saat berguna untuk menyampaikan suatu pesan singkat padat jelas serta hemat biaya pemakaian, data yang disampaikan pun berupa text sehingga data bisa di simpan dan di gunakan untuk keperluan lain. Tetapi dalam kasus yang sama, terjadi penurunan harga dari SMS, hal ini memicu meningkatnya unsolicited commercial advertisements (Spam). Spam sangat mengguntungkan bagi pengirim pesan namun saat mengganggu bagi penerima pesan dikarenakan pesan yang di terima bersifat memaksa dengan output yang sangat besar, peningkatan SMS spam sangat signifikan, pada tahun 2013 di region Asia SMS spam meningkat sebesar 30%. Pada penelitian tugas akhir ini dilakukan analisis dan implementasi Spam detection untuk melakukan filtering pada SMS spam dengan algoritma Artificial Immune System(AIS), sebuah algoritma pengelompokan yang memakai ide dari sistem kekebalan tubuh manusia dengan tamabahan algoritma apriori untuk menghasilkan frequent itemset. Sebagai hasilnya algoritma Artificial Immune System dapat meningkatkan performansi dari sistem sms filtering sebesar 5% dan nilai akurasi dari sistem di atas angka 95%, karena seperti kekebalan tubuh manusia sistem dapat membuat antibody baru yang dapat menanggulangi masalah sms spam dan penggabungan dari kombinasi baru data set yang dihasilkan frequent itemset menambah nilai dari performa sistem. Kata kunci : sms,spam , Artificial Immune System, apriori
Community Detection Menggunakan Genetic Algorithm Dalam Social Network Twitter Itsna Alfin Nur; Moc. Arif Bijaksana; Eko Darwiyanto
eProceedings of Engineering Vol 2, No 3 (2015): Desember, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Twitter telah berkembang dengan pesat menjadi situs social network populer dan telah memiliki jutaan pengguna yang tersebar di berbagai belahan dunia. Twitter saat ini tidak hanya sekedar digunakan untuk media pertemanan, namun seringkali juga digunakan sebagai media bertukar informasi, media iklan sebuah produk, media kampanye partai-partai politik, dan media propaganda bagi kelompok-kelompok yang memiliki tujuan tertentu. Perkembangan social network yang pesat menjadi bahan penelitian yang menarik di kalangan penggiat ilmu informatika, salah satunya adalah community detection pada jaringan kompleks seperti social network. Dalam community detection, tujuannya adalah untuk membagi jaringan ke dalam daerah-daerah pada graph. Daerah tersebut biasanya sesuai dengan entitas-entitas yang memiliki hubungan erat, dan dapat dikatakan sebagai satu komunitas. Salah satu algoritma yang dapat digunakan untuk community detection adalah Algoritma yang di dasarkan pada Genetic Algorithm. Genetic Algorithm dipilih dalam penelitian ini karena dapat menemukan komunitas terbaik dengan memaksimalkan modularitas jaringan. Algoritma ini memiliki O (e) kompleksitas waktu dan tidak perlu mengetahui terlebih dahulu tentang jumlah komunitas atau nilai ambang batas, yang membuat algoritma berguna dalam jaringan di kehidupan nyata. Pembentukan komunitas didasarkan pada nilai similarity berdasarkan interaksi antar pengguna twitter berupa mention, reply, following, dan follower. Hasil akhir dari penelitian ini telah mampu menganalisis pengaruh interaksi berupa mention, reply, following, dan follower pada nilai similarity dan pengaruh nilai similarity tersebut dalam pembentukan komunitas menggunakan Genetic Algorithm. Kata kunci: Twitter, Social network, Community detection, Genetic Algorithm, Similarity.
Stemming Pada Preprocessing Twit Berbahasa Indonesia Dengan Mengimplementasikan Algoritma Fonetik Soundex Untuk Proses Klasifikasi Noviadrianti Noviadrianti; Moc. Arif Bijaksana; Eko Darwiyanto
eProceedings of Engineering Vol 2, No 3 (2015): Desember, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Twitter merupakan layanan jejaring sosial dan microblogging yang memungkinkan penggunanya untuk mengirim dan membaca pesan berbasis teks hingga 140 karakter, dengan kemajuan yang sangat pesat Twitter menjadi objek analisis yang sangat baik untuk berbagai kepentingan, salah satu penelitian yang diminati saat ini terhadap sosial media Twitter adalah analisa sentiment dan opinion mining. Untuk melakukan opinion mining terhadap Twitter menjadi kendala sendiri karena keterbatasan data Twitter dari twit pengguna yang hanya di batasi oleh 140 karakter, selain itu penelitian opinion mining biasanya hanya terfokus pada klasifikasi atau clustering data tetapi tidak banyak menjelaskan tahap Preprocessing, pada dasarnya Preprocessing yang baik akan menghasilkan proses mining yang baik juga, maka perlu berbagai cara untuk memaksimalkan proses Preprocessing pada Twitter salah satunya adalah dengan proses stemming dengan mengimplementasikan algoritma Soundex dimana algoritma ini diharapkan mampu memaksimalkan proses stemming pada Preprocessing untuk proses mining pada Twitter, selain itu metode ini akan di pasangkan dengan berbagai variasi algoritma pembobotan Term Frequency (TF), Feature Term Presence (TP), Term Frequency-Inverse DocumentFrequency (TF-IDF) untuk menemukan pasangan algoritma yang tepat untuk mendukung proses klasifikasi yang baik, klasifikasi dilakukan dengan metode Naïve bayes yang selanjutnya dapat di analisa bagaimana pengaruh algoritma soundex untuk stemming serta pengaruh algoritma pembobotan jika diterapkan pada proses klasifikasi, selain itu penelitian diharapkan mampu menghasilkan algoritma yang memberikan kontribusi yang baik untuk proses stemming data Twitter serta mempelajari bagaiman pengaruh algortitma pembobotan jika dipasangkan dengan algoritma soundex. Setalah dilakukan penelitian terhadap stemming dibandingkan hasil stemming algoritma soundex dengan porter maka didapatkan hasil untuk data uji sebanyak 300 twit bahwa soundex sedikit lebih unggul kemudian diklasifikasikan data hasil stemming dengan soundex dengan beberapa algoritma pembobotan didapatkan hasil nilai akurasi yang sama , berdasarkan analisis didapatkan bahwa algoritma pembobotan tidak berpengaruh kepada hasil klasifikasi. Kata kunci : Twitter, Algoritma Soundex,Stemming, Preprocessing, Naïve bayes
Analisis Dan Implementasi Keterkaitan Semantik Dengan Metode Berbasis Vektor Chandra Pangestu; Moc. Arif Bijaksana
eProceedings of Engineering Vol 3, No 1 (2016): April, 2016
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Keterkaitan semantik adalah mengukur kekuatan koneksi semantik yang ada antara unit tekstual, dalam hal ini antar pasangan kata. keterkaitan antara pasangan kata yang mana memiliki keterkaitan makna. Misalnya ingin menentukan besar nilai keterkaitan semantik antara meja dengan kursi. Untuk mengukur nilai keterkaitan antara pasangan kata tersebut ada beberapa metode yang bisa digunakan yang salah satunya adalah metode yang berbasis vektor. Metode berbasis vektor merupakan salah satu metode yang digunakan untuk mengukur seberapa besar keterkaitan semantik antar pasangan kata. Dengan menggunakan metode vektor ini, sepasang kata akan diubah ke dalam bentuk vektor masing-masing dengan membandingkan beberapa fitur antara kedua kata tersebut. Pada Tugas Akhir ini diimplementasikan dalam bentuk aplikasi untuk mengukur keterkaitan antara sepasang kata dengan metode berbasis vektor, dengan fitur yang didapat dari kedua kata tersebut dengan menggunakan WordNet, metode tf-idf, dan wordsim353 sebagai dataset pengujian yang berisi 252 pasangan kata beserta nilai gold standard. Hasil penelitian yang didapat menggunakan metode berbasis vektor pada wordsim353 didapatkan nilai korelasi sebesar 0,42 dengan menggunakan gloss dan meronim. Dan parameter yang mempengaruhi nilai keterkaitan semantik yang baik adalah dengan menggunakan gloss dan hipernim. Kata Kunci: WordNet, vektor , keterkaitan semantik, tf-idf, pasangan kata, dataset.
Klasifikasi Argumen Semantik Menggunakan Head Word Of Prepositional Phrase Dan First And Last Word / Pos In Constituent Rani Puspitasar; Moc. Arif Bijaksana; Angelina Prima Kurniati
eProceedings of Engineering Vol 2, No 3 (2015): Desember, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Dalam bidang lingustik, argumen semantik merupakan sebuah ekspresi yang digunakan untuk membantu mempelajari makna dari suatu predikat didalam sebuah kalimat. Penggunaan teknik yang tepat dan akurat dalam menganotasikan teks yang memiliki struktur argumen semantik dapat memfasilitasi penemuan pola informasi dalam teks berukuran besar dan dapat memberikan anotasi Who, What, Whom, When, Where, Why, dan How pada kalimat dalam sebuah teks. Penelitian tentang klasifikasi argumen semantik mengimplementasikan penggunaan metode Support Vector Machines (SVM) dalam database PropBank, menggantikan algoritma stastistical classification yang digunakan dalam penelitian sebelumnya, kemudian mengevaluasi perubahan- perubahan yang ada untuk meningkatkan hasil performansi. Selain itu, penelitian menggunakan algoritma SVM tersebut juga memberikan fitur-fitur baru yang diharapkan dapat memberikan kemajuan performansi yang sebelumnya memiliki hasil yang kurang baik. Tugas Akhir ini mengimplementasikan 2 fitur baru yang digunakan bersamaan dengan fitur utama baseline, yaitu Head Word of Prepositional Phrase dan First and Last Word/POS in Constituent yang kemudian diklasifikasikan menggunakan bantuan metode SVM Sequential Minimal Optimization (SMO). Hasil dari pengimplementasian kedua fitur ini secara bersamaan dengan fitur utama memberikan hasil akurasi rata-rata sebesar 67,99%. Kata Kunci: klasifikasi argumen semantik, fitur, Support Vector Machines.
Implementasi Dan Analisis Klasifikasi Spam Pada Pesan Singkat Seluler Dengan Pendekatancollaborative Filtering Menggunakan Naïve Bayes Ricky Kristian Butar Butar; Moc. Arif Bijaksana; Shaufiah Shaufiah
eProceedings of Engineering Vol 2, No 3 (2015): Desember, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Pesan Singkat atau yang dikenal dengan SMS (Short Message Service) merupakan layanan pertukaran pesan antar pengguna layanan tersebut. Semakin banyaknya pengguna layanan SMS, tidak sedikit pihak yang memanfaatkannya untuk mendapatkan keuntungan, yaitu dengan menyebarkan SMS sampah, atau dikenal dengan SMS spam. Oleh karena itu, pada penelitian tugas akhir ini, penulis melakukan pengklasifikasian terhadap SMS yaitu kelas spam maupun ham. Pengklasifikasian SMS tersebut dengan menggunakan pendekatan Collaborative Naïve Bayes yang berorientasi pada rekomendasi beberapa pengguna dan Content-Based Naïve Bayes dengan melihat konten pada SMS. Data rekomendasi didapatkan dengan menyebarkan 300 SMS kepada pengguna. Untuk Content-Based dibutuhkan preprocessing sehingga konten SMS menjadi seragam, memiliki informasi penting, dan mempercepat proses komputasi. Preprocessing yang digunakan adalah slang handling, stopword removal, dan stemming. Pengujian dilakukan dengan membagi SMS menjadi data latih dan data uji sesuai dengan pembagian data cross validation yaitu 5-fold dan 10-fold. Hasil pengujian yang dilakukan menghasilkan tingkat akurasi sebesar 97.12% untuk 5-fold dan 97.28% untuk 10-fold sehingga dikatakan mampu meningkatkan keakurasian pengklasifikasian SMS dengan menggunakan metode Collaborative Filtering. Kata Kunci : Pengklasifikasian, Collaborative, Content-Based, Naïve Bayes, Preprocessing