Claim Missing Document
Check
Articles

Found 8 Documents
Search
Journal : Jurnal Repositor

Pengelompokan Kata Berdasarkan Kemiripan Ucapan Pada Kamus Menggunakan Algoritma Metaphone Pada Sistem Operasi Android Aditya Dwi Maryanto; Yuda Munarko; Yufis Azhar
Jurnal Repositor Vol 1 No 1 (2019): November 2019
Publisher : Universitas Muhammadiyah Malang

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (426.072 KB) | DOI: 10.22219/repositor.v1i1.7

Abstract

Indonesia merupakan negara kepulauan yang terdiri dari berbagai macam suku dan budaya serta bahasa yang berbeda-beda. Salah satunya adalah bahasa Sumbawa yang digunakan oleh masyarakat bagian barat pulau Sumbawa. Bahasa Sumbawa terdapat 4 dialek yaitu Samawa, Taliwang, Jereweh, dan Tongo. Dalam bahasa Sumbawa juga terdapat kata-kata yang bersifat homofon, homonim, dan homograf. Pengelompokkan kata berdasarkan kemiripan ucapan pada kamus Sumbawa dengan algoritma Metaphone pada operating sistem android menjadi pembahasan pada penelitian ini. Algoritma Metaphone dapat diterapkan pada berbagai bahasa dengan aturan yang telah dimodifikasi sesuai dengan karakterisitik bahasa yang diinginkan. Berdasarkan hasil pengujian recall dan precision pada aturan baru algoritma Metaphone dapat disimpulkan bahwa pengelompokkan kata berdasarkan kemiripan ucapan dalam bahasa Sumbawa dapat dikatakan efektif. Indeks persentase rata-rata pengujian recall 98,97% dan precision 78,52%.
Rekomendasi Lowongan Pekerjaan dari Portal Bursa Lowongan Kerja Memanfaatkan Cosine Similarity dan Simple Additive Weighting Rahma Ningsih; Yufis Azhar; Yuda Munarko
Jurnal Repositor Vol 2 No 5 (2020): Mei 2020
Publisher : Universitas Muhammadiyah Malang

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.22219/repositor.v2i5.58

Abstract

Pencarian informasi melalui portal bursa lowongan kerja memanfaatkan mesin pencari (search engine) yang terdapat pada situs layanan. Hasil pencarian oleh sistem didasarkan pada kesamaan query inputan, kemudian hasilnya ditampilkan dengan model sortir yang terbatas pada hierarkis abjad atau angka. Sehingga diperlukan waktu lagi untuk memilah informasi yang dibutuhkan, karena hasil informasi yang ditampilkan sistem juga diantaranya merupakan informasi yang kurang sesuai. Sebab itu diperlukanlah adanya pengembangan model perankingan terhadap rekomendasi informasi dari hasil pencarian tersebut. Metode cosine similarity dalam pengimplementasiannya menghasilkan data sesuai dengan query yang diinputkan user, serta ditambah dengan menerapkan metode simple additive weighting sebagai metode perankingan terhadap data retrive hasil cosine similarity. Sistem memiliki fitur unggulan, yaitu model perankingan yang bertingkat sehingga user dapat menentukan sendiri aturan perankingan dengan menentukan kriteria mana yang cendrung dominan.
Perbandingan Kinerja Komputasi Hadoop dan Spark untuk Memprediksi Cuaca (Studi Kasus : Storm Event Database) Rendiyono Wahyu Saputro; Aminuddin Aminuddin; Yuda Munarko
Jurnal Repositor Vol 2 No 4 (2020): April 2020
Publisher : Universitas Muhammadiyah Malang

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.22219/repositor.v2i4.93

Abstract

Perkembangan teknologi telah mengakibatkan pertumbuhan data yang semakin cepat dan besar setiap waktunya. Hal tersebut disebabkan oleh banyaknya sumber data seperti mesin pencari, RFID, catatan transaksi digital, arsip video dan foto, user generated content, internet of things, penelitian ilmiah di berbagai bidang seperti genomika, meteorologi, astronomi, fisika, dll. Selain itu, data - data tersebut memiliki karakteristik yang unik antara satu dengan lainnya, hal ini yang menyebabkan tidak dapat diproses oleh teknologi basis data konvensional. Oleh karena itu, dikembangkan beragam framework komputasi terdistribusi seperti Apache Hadoop dan Apache Spark yang memungkinkan untuk memproses data secara terdistribusi dengan menggunakan gugus komputer.Adanya ragam framework komputasi terdistribusi, sehingga diperlukan sebuah pengujian untuk mengetahui kinerja komputasi keduanya. Pengujian dilakukan dengan memproses dataset dengan beragam ukuran dan dalam gugus komputer dengan jumlah node yang berbeda. Dari semua hasil pengujian, Apache Hadoop memerlukan waktu yang lebih sedikit dibandingkan dengan Apache Spark. Hal tersebut terjadi karena nilai throughput dan throughput/node Apache Hadoop lebih tinggi daripada Apache Spark.
Data Warehouse Menggunakan Snowflake Schema Pada Virtual Shop Vicky Novreza; Yuda Munarko; Lailatul Husniah
Jurnal Repositor Vol 2 No 1 (2020): Januari 2020
Publisher : Universitas Muhammadiyah Malang

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.22219/repositor.v2i1.180

Abstract

Virtual shop adalah penerapan teknologi virtual realiy pada toko online guna meningkatkan interaksi pembeli. Penerarapan virtual reality pada online shop menimbulkan pertanyaan untuk penyimpanan data serta pengolahan data sebagai analisa kebutuhan. Data pada toko online sebatas pada data transaksional dan tidak dilakukan pengolahan yang lebih untuk dilakukan analisa. Solusi dari permasalahan tersebut dengan melakukan perancangan data warehouse untuk menyiapkan tempat penyimpanan data agar analisa dapat dilakukan guna pengembangan teknologi virtual shop. Sistem pada data warehouse dapat sebagai repository data yang digunakan oleh virtual shop. Penelitian ini menerapkan multidimensional snowflakes schema dengan tujuan me-normalisasi tabel dimensi sehingga tidak terjadi redudansi data khusus pada tabel dimensi. Menerapkan metode desain data multidimensional dari Moody pada Multidimensional snowflakes schema, from ER models to Dimensional models. Untuk mendukung penelitian ini, Peneliti melakukan analisis pada data warehouse dengan menggunakan OLAP Cube Reporting berbasis web.
Parsing Twitter Menggunakan Metode Left-Corner Parsing Dengan Memanfaatkan POS Tagger Dyah Anitia; Yuda Munarko; Yufis Azhar
Jurnal Repositor Vol 2 No 7 (2020): Juli 2020
Publisher : Universitas Muhammadiyah Malang

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.22219/repositor.v2i7.203

Abstract

Pada penelitian ini dilakukan investigasi parser dengan pendekatan left-corner untuk data tweet bahasa Indonesia. Total koleksi tweet sebanyak 850 tweet yang dibagi menjadi tiga kumpulan data, yakni data train POS Tagger, data train dan data uji. Left-corner menggabungkan dua metode yakni top-down dan bottom-up. Dimana top-down digunakan pada proses pengenalan kelas kata dan bottom-up digunakan pada proses pengenalan struktur kalimat. Adapun jenis tag yang digunakan dalam proses top-down berjumlah 23 tagset dan frasa yang digunakan untuk menentukan struktur kalimat frasa yakni frasa nomina, frasa verbal, frasa adjektiva, frasa adverbia dan frasa preposisional. Hasilnya adalah untuk pendekatan left corner mencapai nilai precision 88,29%, nilai recall 68,3% dan F1 measure 77,02%. Nilai yang diperoleh dengan pendekatan left-corner lebih besar dibandingkan nilai dengan pendekatan bottom-up. Hasil dari nilai yang diperoleh dengan bottom up mencapai nilai precision 68,79%, nilai recall 47,12% dan F1 measure 55,9%. Hal ini disebabkan penggunaan kelas kata pada proses top-down berpengaruh pada sturuktur kalimat pada proses bottom up.
Rancang Bangun Sistem Simulasi Evaluasi Borang Berdasarkan Pedoman BAN-PT Pada Standar 3,5 dan 6 Di Jurusan Teknik Informatika UMM Anisah Rahmatul Laily; Yuda Munarko; Maskur Maskur
Jurnal Repositor Vol 2 No 12 (2020): Desember 2020
Publisher : Universitas Muhammadiyah Malang

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.22219/repositor.v2i12.503

Abstract

Seiring perkembangan teknologi dan pesatnya persaingan antar kampus negeri maupun swasta untuk meningkatkan mutu akreditasi, maka dibuatlah perancangan sistem simulasi akreditasi yang dapat memberikan keputusan untuk mempermudah prodi mengambil keputusan. Dimana prodi dapat melakukan simulasi untuk mendapatkan nilai akreditasi yang diinginkan. Penilaian akreditasi berdasarkan buku pedoman Badan Akreditasi Nasional Perguruan Tinggi (BAN-PT). Pada perancangan dan implementasi perangkat lunak ini menghasilkan sebuah sistem simulasi akreditasi yang berbasis website Sehingga prodi dengan mudah menentukan keputusan. Pengembangan yang digunakan Software Development Life Cycle (SDLC) dan model pengembangan sistem simulasi akreditasi ini adalah waterfall. Sistem simulasi akreditasi yang dibangun telah melalui proses pengujian blackbox berdasarkan kebutuhan dan pengujian keseuaian menurut pakar. Hasil pengujian blackbox menunjukkan bahwa pengisian data pada setiap form berhasil dilakukan dengan sukses dan secara fungsional sistem tersebut dapat menghasilkan output yang diharapkan. Hasil pengujian kesesuaian pakar menunjukkan bahwa dari 5 pertanyaan terdapat 4 yang setuju dan 1 tidak setuju.
Metode Cluster Importance Untuk Peringkasan Dokumen Pada Data Tweet Berbahasa Indonesia (Study Kasus Pilkada Dki Jakarta) Dyah Hestiningtyas; Nur Hayatin; Yuda Munarko
Jurnal Repositor Vol 2 No 6 (2020): Juni 2020
Publisher : Universitas Muhammadiyah Malang

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.22219/repositor.v2i6.665

Abstract

Pemanfaatan media elektronik sebagai media informasi berkembang sangat pesat di era sekarang. Terbukti meningkatnya jumlah informasi dan data. Banyaknya data yang ada diharapkan dapat memberikan manfaat yang banyak pula. Automatic Text Summarization merupakan salah satu proses peringkasan teks dokumen yang dilakukan secara otomatis melalui mesin komputer. Pada penelitian ini penulis membahas tentang peringkasan dokumen pada tweet, dimana data yang digunakan dengam mengumpulkan tweet melalui web crawler dengan memanfaatkan API Twitter. Pada paper ini diajukan sebuah metode Cluster Importance dan melakukan pemilihan tweet representatif pada setiap cluster berdasarkan bobot tweet terpenting pada suatu cluster. Yang nantinya bobot tweet tertinggi dipilih sebagai tweet penyusun ringkasan. Penelitian ini menggunakan 25 topik. hasil dari perhitungan Rouge-N yaitu: Dari 25 topik data uji ada 3topik yang mempunyai Iterasi 1 yaitu topik HUT DKI, Kinerja Djarot, dan Pemimpin dikarenakan jumlah tweet pada topik tersebut sama - sama memiliki 2 tweet. Pengujian perbandingan antara hasil manual dan hasil sistem menunjukan hasil 100% pada topik Dukungan. Perhitungan Rouge-N menyimpulkan bahwa sistem dapat merangkum tweet minimal 3 tweet, dari perbandingan hasil sistem dan manual di dapatkan tweet minimal mempunyai nilai 96% yang di mana sistem bekerja dengan baik, serta pada topik yang memiliki 18 tweet menunjukan hasil 89%.
Perbandingan Metode Klasifikasi Berita Hoaks Berbahasa Indonesia Berbasis Pembelajaran Mesin Muhammad Athaillah; Yufis Azhar; Yuda Munarko
Jurnal Repositor Vol 2 No 5 (2020): Mei 2020
Publisher : Universitas Muhammadiyah Malang

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.22219/repositor.v2i5.692

Abstract

Klasifiaksi berita hoaks merupakan salah satu aplikasi kategorisasi teks. Berita hoaks harus diklasifikasikan karena berita hoaks dapat mempengaruhi tindakan dan pola pikir pembaca. Dalam proses klasifikasi pada penelitian ini menggunakan beberapa tahapan yaitu praproses, ekstraksi fitur, seleksi fitur dan klasifikasi. Penelitian ini bertujuan membandingkan dua algoritma yaitu algoritma Naïve Bayes dan Multinomial Naïve Bayes, manakah dari kedua algoritma tersebut yang lebih efektif dalam mengklasifikasikan berita hoaks. Data yang digunakan dalam penelitian ini berasal dari www.trunbackhoax.id untuk data berita hoaks sebanyak 100 artikel dan data berita non-hoaks berasal dari kompas.com, detik.com berjumlah 100 artikel. Data latih berjumlah 140 artikel dan data uji berjumlah 60 artikel. Hasil perbandingan algoritma Naïve Bayes memiliki nilai F1-score sebesar 0,93 dan nilai F1-score Multinomial Naïve Bayes sebesar 0,92.