Claim Missing Document
Check
Articles

Found 29 Documents
Search

Peringkasan Tweet Berdasarkan Trending Topic Twitter Dengan Pembobotan TF-IDF dan Single Linkage Angglomerative Hierarchical Clustering Annisa Annisa; Yuda Munarko; Yufis Azhar
Kinetik: Game Technology, Information System, Computer Network, Computing, Electronics, and Control Vol 1, No 1, May-2016
Publisher : Universitas Muhammadiyah Malang

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (539.422 KB) | DOI: 10.22219/kinetik.v1i1.7

Abstract

Fitur yang paling sering digunakan pada Twitter ialah Trending Topic. Trending Topic merupakan fitur yang menampilkan beberapa hashtag berisi topik yang sedang trend saat ini. Jika pengguna ingin mengetahui informasi mengenai suatu trending topic, pengguna bisa mengklik salah satu hashtag dan barulah muncul beberapa tweet terkait dengan hashtag tersebut. Agar menghemat waktu pengguna Twitter dalam membaca suatu trending topic tanpa perlu membaca beberapa tweet terlebih dahulu, maka dilakukanlah analisa dengan tujuan membuat text summarization untuk trending topic pada Twitter menggunakan algoritma TF-IDF dan Single Linkage Agglomerative Hierarchical Clustering. Penelitian ini menggunakan 100 trending topic untuk data tes pada sistem dan setiap trending topic terdiri atas 50 tweet berbahasa indonesia, sedangkan untuk pengujian digunakan 30 data trending topic diambil secara acak (data mewakili trending topic dengan sub tema minimal 2 dan maksimal 9 dari 100 data tes pada sistem). Dari 30 data pengujian, 1 data menghasilkan semua ringkasan sama persis dengan ahli,  dan 29 data menghasilkan 1-4  ringkasan sama persis dengan ahli (terdiri atas 2-9 ringkasan untuk setiap trending topic).
POS Tagger Tweet Bahasa Indonesia Yuda Munarko; yufis azhar; Maulina Balqis; Susi Ekawati
Kinetik: Game Technology, Information System, Computer Network, Computing, Electronics, and Control Vol 2, No 1, February-2017
Publisher : Universitas Muhammadiyah Malang

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.22219/kinetik.v2i1.169

Abstract

Pada penelitian ini dilakukan investigasi POS Tagger dengan pendekatan Cyclic Dependency Network untuk data tweet dalam Bahasa Indonesia. Untuk koleksi tweet, digunakan tiga koleksi data, yakni tweet dengan gaya bahasa formal, informal dan gabungan. Sumber koleksi tweet formal adalah tweet dari akun berita, sedangkan koleksi tweet informal didapatkan dari akun umum.  Adapun jenis tag yang digunakan berjumlah 41, dimana 35 adalah standar tag Bahasa Indonesia dan 6 adalah tambahan tag untuk twitter. Hasilnya adalah untuk koleksi data formal ketepatan deteksi mencapai 95,42%. Sedangkan untuk koleksi data informal dan gabungan ketepatannya mencapai 92,42% dan 90,69% secara berurutan. Kami juga mendapatkan hasil bahwa untuk tag yang sering muncul cenderung untuk memiliki nilai ketepatan yang tinggi juga, sedangkan tag yang kemunculannya lebih sedikit menyebabkan penurunan rata-rata ketepat secara keseluruhan.
Pengelompokan Kata Berdasarkan Kemiripan Ucapan Pada Kamus Menggunakan Algoritma Metaphone Pada Sistem Operasi Android Aditya Dwi Maryanto; Yuda Munarko; Yufis Azhar
Jurnal Repositor Vol 1 No 1 (2019): November 2019
Publisher : Universitas Muhammadiyah Malang

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (426.072 KB) | DOI: 10.22219/repositor.v1i1.7

Abstract

Indonesia merupakan negara kepulauan yang terdiri dari berbagai macam suku dan budaya serta bahasa yang berbeda-beda. Salah satunya adalah bahasa Sumbawa yang digunakan oleh masyarakat bagian barat pulau Sumbawa. Bahasa Sumbawa terdapat 4 dialek yaitu Samawa, Taliwang, Jereweh, dan Tongo. Dalam bahasa Sumbawa juga terdapat kata-kata yang bersifat homofon, homonim, dan homograf. Pengelompokkan kata berdasarkan kemiripan ucapan pada kamus Sumbawa dengan algoritma Metaphone pada operating sistem android menjadi pembahasan pada penelitian ini. Algoritma Metaphone dapat diterapkan pada berbagai bahasa dengan aturan yang telah dimodifikasi sesuai dengan karakterisitik bahasa yang diinginkan. Berdasarkan hasil pengujian recall dan precision pada aturan baru algoritma Metaphone dapat disimpulkan bahwa pengelompokkan kata berdasarkan kemiripan ucapan dalam bahasa Sumbawa dapat dikatakan efektif. Indeks persentase rata-rata pengujian recall 98,97% dan precision 78,52%.
Rekomendasi Lowongan Pekerjaan dari Portal Bursa Lowongan Kerja Memanfaatkan Cosine Similarity dan Simple Additive Weighting Rahma Ningsih; Yufis Azhar; Yuda Munarko
Jurnal Repositor Vol 2 No 5 (2020): Mei 2020
Publisher : Universitas Muhammadiyah Malang

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.22219/repositor.v2i5.58

Abstract

Pencarian informasi melalui portal bursa lowongan kerja memanfaatkan mesin pencari (search engine) yang terdapat pada situs layanan. Hasil pencarian oleh sistem didasarkan pada kesamaan query inputan, kemudian hasilnya ditampilkan dengan model sortir yang terbatas pada hierarkis abjad atau angka. Sehingga diperlukan waktu lagi untuk memilah informasi yang dibutuhkan, karena hasil informasi yang ditampilkan sistem juga diantaranya merupakan informasi yang kurang sesuai. Sebab itu diperlukanlah adanya pengembangan model perankingan terhadap rekomendasi informasi dari hasil pencarian tersebut. Metode cosine similarity dalam pengimplementasiannya menghasilkan data sesuai dengan query yang diinputkan user, serta ditambah dengan menerapkan metode simple additive weighting sebagai metode perankingan terhadap data retrive hasil cosine similarity. Sistem memiliki fitur unggulan, yaitu model perankingan yang bertingkat sehingga user dapat menentukan sendiri aturan perankingan dengan menentukan kriteria mana yang cendrung dominan.
Perbandingan Kinerja Komputasi Hadoop dan Spark untuk Memprediksi Cuaca (Studi Kasus : Storm Event Database) Rendiyono Wahyu Saputro; Aminuddin Aminuddin; Yuda Munarko
Jurnal Repositor Vol 2 No 4 (2020): April 2020
Publisher : Universitas Muhammadiyah Malang

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.22219/repositor.v2i4.93

Abstract

Perkembangan teknologi telah mengakibatkan pertumbuhan data yang semakin cepat dan besar setiap waktunya. Hal tersebut disebabkan oleh banyaknya sumber data seperti mesin pencari, RFID, catatan transaksi digital, arsip video dan foto, user generated content, internet of things, penelitian ilmiah di berbagai bidang seperti genomika, meteorologi, astronomi, fisika, dll. Selain itu, data - data tersebut memiliki karakteristik yang unik antara satu dengan lainnya, hal ini yang menyebabkan tidak dapat diproses oleh teknologi basis data konvensional. Oleh karena itu, dikembangkan beragam framework komputasi terdistribusi seperti Apache Hadoop dan Apache Spark yang memungkinkan untuk memproses data secara terdistribusi dengan menggunakan gugus komputer.Adanya ragam framework komputasi terdistribusi, sehingga diperlukan sebuah pengujian untuk mengetahui kinerja komputasi keduanya. Pengujian dilakukan dengan memproses dataset dengan beragam ukuran dan dalam gugus komputer dengan jumlah node yang berbeda. Dari semua hasil pengujian, Apache Hadoop memerlukan waktu yang lebih sedikit dibandingkan dengan Apache Spark. Hal tersebut terjadi karena nilai throughput dan throughput/node Apache Hadoop lebih tinggi daripada Apache Spark.
Data Warehouse Menggunakan Snowflake Schema Pada Virtual Shop Vicky Novreza; Yuda Munarko; Lailatul Husniah
Jurnal Repositor Vol 2 No 1 (2020): Januari 2020
Publisher : Universitas Muhammadiyah Malang

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.22219/repositor.v2i1.180

Abstract

Virtual shop adalah penerapan teknologi virtual realiy pada toko online guna meningkatkan interaksi pembeli. Penerarapan virtual reality pada online shop menimbulkan pertanyaan untuk penyimpanan data serta pengolahan data sebagai analisa kebutuhan. Data pada toko online sebatas pada data transaksional dan tidak dilakukan pengolahan yang lebih untuk dilakukan analisa. Solusi dari permasalahan tersebut dengan melakukan perancangan data warehouse untuk menyiapkan tempat penyimpanan data agar analisa dapat dilakukan guna pengembangan teknologi virtual shop. Sistem pada data warehouse dapat sebagai repository data yang digunakan oleh virtual shop. Penelitian ini menerapkan multidimensional snowflakes schema dengan tujuan me-normalisasi tabel dimensi sehingga tidak terjadi redudansi data khusus pada tabel dimensi. Menerapkan metode desain data multidimensional dari Moody pada Multidimensional snowflakes schema, from ER models to Dimensional models. Untuk mendukung penelitian ini, Peneliti melakukan analisis pada data warehouse dengan menggunakan OLAP Cube Reporting berbasis web.
Parsing Twitter Menggunakan Metode Left-Corner Parsing Dengan Memanfaatkan POS Tagger Dyah Anitia; Yuda Munarko; Yufis Azhar
Jurnal Repositor Vol 2 No 7 (2020): Juli 2020
Publisher : Universitas Muhammadiyah Malang

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.22219/repositor.v2i7.203

Abstract

Pada penelitian ini dilakukan investigasi parser dengan pendekatan left-corner untuk data tweet bahasa Indonesia. Total koleksi tweet sebanyak 850 tweet yang dibagi menjadi tiga kumpulan data, yakni data train POS Tagger, data train dan data uji. Left-corner menggabungkan dua metode yakni top-down dan bottom-up. Dimana top-down digunakan pada proses pengenalan kelas kata dan bottom-up digunakan pada proses pengenalan struktur kalimat. Adapun jenis tag yang digunakan dalam proses top-down berjumlah 23 tagset dan frasa yang digunakan untuk menentukan struktur kalimat frasa yakni frasa nomina, frasa verbal, frasa adjektiva, frasa adverbia dan frasa preposisional. Hasilnya adalah untuk pendekatan left corner mencapai nilai precision 88,29%, nilai recall 68,3% dan F1 measure 77,02%. Nilai yang diperoleh dengan pendekatan left-corner lebih besar dibandingkan nilai dengan pendekatan bottom-up. Hasil dari nilai yang diperoleh dengan bottom up mencapai nilai precision 68,79%, nilai recall 47,12% dan F1 measure 55,9%. Hal ini disebabkan penggunaan kelas kata pada proses top-down berpengaruh pada sturuktur kalimat pada proses bottom up.
Rancang Bangun Sistem Simulasi Evaluasi Borang Berdasarkan Pedoman BAN-PT Pada Standar 3,5 dan 6 Di Jurusan Teknik Informatika UMM Anisah Rahmatul Laily; Yuda Munarko; Maskur Maskur
Jurnal Repositor Vol 2 No 12 (2020): Desember 2020
Publisher : Universitas Muhammadiyah Malang

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.22219/repositor.v2i12.503

Abstract

Seiring perkembangan teknologi dan pesatnya persaingan antar kampus negeri maupun swasta untuk meningkatkan mutu akreditasi, maka dibuatlah perancangan sistem simulasi akreditasi yang dapat memberikan keputusan untuk mempermudah prodi mengambil keputusan. Dimana prodi dapat melakukan simulasi untuk mendapatkan nilai akreditasi yang diinginkan. Penilaian akreditasi berdasarkan buku pedoman Badan Akreditasi Nasional Perguruan Tinggi (BAN-PT). Pada perancangan dan implementasi perangkat lunak ini menghasilkan sebuah sistem simulasi akreditasi yang berbasis website Sehingga prodi dengan mudah menentukan keputusan. Pengembangan yang digunakan Software Development Life Cycle (SDLC) dan model pengembangan sistem simulasi akreditasi ini adalah waterfall. Sistem simulasi akreditasi yang dibangun telah melalui proses pengujian blackbox berdasarkan kebutuhan dan pengujian keseuaian menurut pakar. Hasil pengujian blackbox menunjukkan bahwa pengisian data pada setiap form berhasil dilakukan dengan sukses dan secara fungsional sistem tersebut dapat menghasilkan output yang diharapkan. Hasil pengujian kesesuaian pakar menunjukkan bahwa dari 5 pertanyaan terdapat 4 yang setuju dan 1 tidak setuju.
Metode Cluster Importance Untuk Peringkasan Dokumen Pada Data Tweet Berbahasa Indonesia (Study Kasus Pilkada Dki Jakarta) Dyah Hestiningtyas; Nur Hayatin; Yuda Munarko
Jurnal Repositor Vol 2 No 6 (2020): Juni 2020
Publisher : Universitas Muhammadiyah Malang

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.22219/repositor.v2i6.665

Abstract

Pemanfaatan media elektronik sebagai media informasi berkembang sangat pesat di era sekarang. Terbukti meningkatnya jumlah informasi dan data. Banyaknya data yang ada diharapkan dapat memberikan manfaat yang banyak pula. Automatic Text Summarization merupakan salah satu proses peringkasan teks dokumen yang dilakukan secara otomatis melalui mesin komputer. Pada penelitian ini penulis membahas tentang peringkasan dokumen pada tweet, dimana data yang digunakan dengam mengumpulkan tweet melalui web crawler dengan memanfaatkan API Twitter. Pada paper ini diajukan sebuah metode Cluster Importance dan melakukan pemilihan tweet representatif pada setiap cluster berdasarkan bobot tweet terpenting pada suatu cluster. Yang nantinya bobot tweet tertinggi dipilih sebagai tweet penyusun ringkasan. Penelitian ini menggunakan 25 topik. hasil dari perhitungan Rouge-N yaitu: Dari 25 topik data uji ada 3topik yang mempunyai Iterasi 1 yaitu topik HUT DKI, Kinerja Djarot, dan Pemimpin dikarenakan jumlah tweet pada topik tersebut sama - sama memiliki 2 tweet. Pengujian perbandingan antara hasil manual dan hasil sistem menunjukan hasil 100% pada topik Dukungan. Perhitungan Rouge-N menyimpulkan bahwa sistem dapat merangkum tweet minimal 3 tweet, dari perbandingan hasil sistem dan manual di dapatkan tweet minimal mempunyai nilai 96% yang di mana sistem bekerja dengan baik, serta pada topik yang memiliki 18 tweet menunjukan hasil 89%.
Perbandingan Metode Klasifikasi Berita Hoaks Berbahasa Indonesia Berbasis Pembelajaran Mesin Muhammad Athaillah; Yufis Azhar; Yuda Munarko
Jurnal Repositor Vol 2 No 5 (2020): Mei 2020
Publisher : Universitas Muhammadiyah Malang

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.22219/repositor.v2i5.692

Abstract

Klasifiaksi berita hoaks merupakan salah satu aplikasi kategorisasi teks. Berita hoaks harus diklasifikasikan karena berita hoaks dapat mempengaruhi tindakan dan pola pikir pembaca. Dalam proses klasifikasi pada penelitian ini menggunakan beberapa tahapan yaitu praproses, ekstraksi fitur, seleksi fitur dan klasifikasi. Penelitian ini bertujuan membandingkan dua algoritma yaitu algoritma Naïve Bayes dan Multinomial Naïve Bayes, manakah dari kedua algoritma tersebut yang lebih efektif dalam mengklasifikasikan berita hoaks. Data yang digunakan dalam penelitian ini berasal dari www.trunbackhoax.id untuk data berita hoaks sebanyak 100 artikel dan data berita non-hoaks berasal dari kompas.com, detik.com berjumlah 100 artikel. Data latih berjumlah 140 artikel dan data uji berjumlah 60 artikel. Hasil perbandingan algoritma Naïve Bayes memiliki nilai F1-score sebesar 0,93 dan nilai F1-score Multinomial Naïve Bayes sebesar 0,92.