Claim Missing Document
Check
Articles

Found 34 Documents
Search

Analisis Dan Implementasi Graph Clustering Pada Berita Online Menggunakan Algoritma Chinese Whispers Mochammad Fitrah Eka Pramudita; Kemas Rahmat Saleh Wiharja; Anisa Herdiani
eProceedings of Engineering Vol 3, No 1 (2016): April, 2016
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Berita online saat ini merupakan sesuatu yang sangat umum dikalangan masyarakat Indonesia. Data berita online yang telah tersimpan pada suatu penyimpanan data mencapai ratusan miliar berita. Oleh sebab itu diperlukan suatu permodelan, agar memudahkan proses pencarian, manipulasi atau pengolahan data tersebut. Salah satu model yang sangat cocok untuk data berita tersebut adalah model graph. Untuk memudahkan pembaca maka berita online tersebut perlu dikelompokkan berdasarkan keterkaitan isi beritanya. Salah satu metode yang bisa dimanfaatkan untuk mengelompokkan berita adalah dengan graph clustering. Sebelum melakukan graph clustering, data berita online harus diubah menjadi model graph. Langkah pertama untuk mengubah data berita kebentuk graph adalah melakukan preprocessing, lalu dihitung bobot keterkaitan isi beritanya dengan memanfaatkan cosine similarity, setelah itu bobot hasil cosine similarity dinormalisasi untuk dijadikan edge yang menghubungkan node dokumen berita. Setelah berbentuk graph, barulah dilakukan proses graph clustering. Dalam penelitian ini algoritma graph clustering yang digunakan adalah Chinese Whispers, karena Chinese Whispers mampu membentuk cluster dari data graph yang besar dengan waktu yang relatif cepat, sehingga sangat cocok digunakan untuk kasus clustering berita online. Pada penelitian ini telah diuji performasi algoritma Chinese Whispers dari segi kualitas serta tingkat akurasi cluster yang dihasilkan. Setelah dilakukan pengujian diperoleh bahwa kuliatas hasil cluster Chinese Whisper cukup bagus karena hampir 95% node hasil cluster sudah memiliki nilai intra- cluster yang lebih tinggi dari pada inter-cluster-nya, sedangkan rata-rata akurasi dari proses clustering menggunakan algoritma Chinese Whispers adalah 80.0 %. Kata kunci : Graph, Graph Database, Clustering, Graph Clustering, Chinese Whispers
Analisis Dan Implementasi Basis Data Terdistribusi Horizontal Pada Mongodb Untuk Clikkb Bkkbn Regional Jawa Barat Nunit Prihatoni Siregar; Kemas Rahmat Saleh Wiharja; Alfian Akbar Gozali
eProceedings of Engineering Vol 2, No 2 (2015): Agustus, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak ClikKB merupakan sistem yang dimiliki oleh dinas BKKBN regional Jawa Barat. Format data ClikKB yang disimpan dalam file excel menyebabkan pengisian banyak bernilai null. Nilai null pada ClikKB menyebabkan struktur data menjadi semi terstruktur. Data semi terstruktur dapat disebut dengan nonuniform data yaitu dokumen yang memiliki atribut yang berbeda-beda. Dari berbagai varian NoSQL, document oriented digunakan untuk mengatasi masalah nonuniform data. Karena mencakup wilayah Jawa Barat, maka data dari ClikKB cukup besar. Sistem ini memiliki proses read dan write yang tinggi karena diakses oleh seluruh dinas BKKBN Jawa Barat. Hal ini akan mempengaruhi performansi sistem. Untuk meningkatkan performansi sistem, dilakukan proses distribusi yaitu teknik penyimpanan basis data yang dipecah kebeberapa lokasi penyimpanan yang terhubung dengan jaringan. Salah satu DBMS dari NoSQL adalah MongoDB. MongoDB memiliki kemampuan untuk distribusi data. Yang diimplementasikan ada 3 arsitektur yaitu penerapan Document Oriented Database single server, penerapan sharding dengan 2 node, dan sharding 3 node. Jenis fragmentasi atau pembagian data yang digunakan adalah horizontal specification karena MongoDB memiliki fitur tersebut. Secara umum, diimplementasikannya distribusi pada document oriented database ini menghasilkan peningkatan response time hingga 167,55% jika dibandingkan tanpa proses distribusi. Kata Kunci: null value , NoSQL, Document Oriented Database, MongoDB, sharding.
Analisis Dan Implementasi Algoritma Gspan Dan Lpboost Pada Klasifikasi Struktur Molekul Kimia Ahmad Ridwan Rezani; Kemas Rahmat Saleh Wiharja; Nungki Selviandro
eProceedings of Engineering Vol 2, No 3 (2015): Desember, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Perkembangan teknologi dan informasi tentang pemodelan data elektronik yang semakin meningkat seperti xml text, html,graph, senyawa kimia dan lain lain menyebabkan jumlah aplikasi untuk memodelkan data tersebut semakin pesat. Salah satu yang popular dan banyak dikembangkan yaitu Graph. Graph sangat powerful karena bisa memodelkan struktur yang kompleks. Salah satu penerapannya yaitu risk assessment, toxic prediction dan regulatory decision. Studi mengenai graph berbasis classification masih kurang dan untuk penerapannya masih jarang sehingga perlu penelitian lebih lanjut guna mendapatkan pemodelan data yang baik. Berbagai penelitian telah dilakukan dengan menggunakan teknik dalam klasifikasi graph salah satunya Graph Classification yang bisa diterapkan untuk chemical compound. Dalam penelitian Tugas Akhir ini akan membahas tentang metode Graph Classification dengan menggunakan algoritma gSpan dan Boosting dalam melakukan klasifikasi molekul kimia dan menghitung akurasi yang diperoleh. Tujuannya untuk menentukan dan mengidentifikasi apakah suatu molekul kimia mengandung mutagen atau tidak berdasarkan model klasifikasi yang dibuat. Model klasifikasi ini akan membuat prediction rule dengan beberapa iterasi untuk mendapatkan pola. Pola ini didapatkan dengan cara mengenumerasi secara frequent kemunculan pola subgraph yang bisa digunakan sebagai feature dalam klasifikasi. Pemilihan teknik yang tepat dan rancangan sistem yang benar akan menghasilkan performansi sistem yang maksimal. molekul kimia dipilih karena keunggulan dan keunikannya yaitu memiliki ciri vertex berlabel dan edge yang tidak berarah sehingga molekul kimia cocok jika direpresentasikan dengan graph. Metode Graph Classification akan mengklasifikasi graph yang mempunyai karakteristik struktural information serta menggunakan semua subgrah yang terseleksi sebagai set fitur. Hasil dari penelitian ini menunjukan efisiensi dari algoritma gSpan dan Boosting untuk molekul kimia dengan akurasi tertinggi yaitu 78,18 %. Kata kunci: Graph Classification, Frequent Subgraph Mining, Klasifikasi, Cheminformatics
Implementasi Dan Analisis Performansi Mapreduce Di Lingkungan Sistem Basisdata Berbasis Dokumen Terdistribusi Homogen Hegar Aryo Dewandaru; Kemas Rahmat Saleh Wiharja; Alfian Akbar Gozali
eProceedings of Engineering Vol 2, No 3 (2015): Desember, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Pada sebuah perusahaan besar, sangatlah penting untuk memiliki manajemen sistem basisdata yang mampu menampung seluruh data dan dokumen milik karyawan. Data tersebut akan sangat besar sehingga tidak akan memunkinkan untuk ditampung oleh single server. Untuk menyelesaikan masalah tersebut, data yang sangat besar itu dapat didistribusikan ke dalam beberapa cluster. Di lingkungan terdistribusi inilah implementasi dari metode MapReduce akan sangat bermanfaat bagi sistem. MapReduce adalah sebuah operasi untuk menyelesaikan masalah yang mirip dengan algoritma divide and conquer. Sesuai dengan namanya, MapReduce terdiri dari proses map (pemetaan) suatu data dan reduce (pengurangan) yang berakhir pada penggabungan data-data yang sama. Pada tugas akhir ini akan dilakukan penelitian terhadap performansi MapReduce di lingkungan sistem basisdata terdistribusi homogen. Untuk membangun lingkungan tersebut, sebelumnya harus dilakukan pengecekan terhadap setiap komputer yang digunakan. Pastikan bahwa seluruh komputer memiliki spesifikasi perangkat lunak dan keras, serta manajemen sistem basisdata yang sama. Setelah itu, dataset yang berbasis dokumen harus di-import ke database komputer yang berperan sebagai master. Kemudian, dengan menggunakan metode sharding, setiap node akan diberi peran: master akan berberan sebagai router, satu node sebagai config server, dan sisanya sebagai shard server sehingga terbentuklah lingkungan sistem basisdata berbasis dokumen terdistribusi homogen. Dataset kemudian akan didistribusikan ke setiap shard. Akhirnya, query MapReduce akan dijalankan dan diuji di single server dan 3 arsitektur distributed database yang berbeda untuk diteliti performansinya. Dari hasil pengujian yang dilakukan, dapat dilihat bahwa MapReduce bekerja lebih baik di lingkungan terdistribusi dibandingkan dengan pada single server. Kesimpulan yang dapat diambil adalah bahwa sistem basisdata terdistribusi meningkatkan performansi MapReduce. Kata kunci: MapReduce, document-oriented database, distributed database system, distributed database management system, homogeneous distributed database
Analisis Dan Implementasi Graph Clustering Pada Berita Digital Menggunakan Algoritma Star Clustering Aufa Bil Ahdi P; Kemas Rahmat Saleh W; Anisa Herdiani
eProceedings of Engineering Vol 3, No 2 (2016): Agustus, 2016
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Berkembangnya media Internet saat ini mempengaruhi penyebaran informasi melalui Internet menggunakan berbagai macam media. Salah satu bentuk pengembangan media informasi saat ini adalah banyaknya artikel berita digital yang tersebar secara online. Oleh karena banyaknya penyebaran berita digital, diperlukan pengelompokkan berita berdasarkan topik dan keterkaitan tertentu dengan menerapkan model graph untuk memetakan hubungan berita. Model graph dipilih karena dapat memodelkan hubungan antar objek dan memberikan visualisasi yang mudah dipahami. Berita dapat direpresentasikan sebagai node dan dapat dihubungkan dengan node lain yang memiliki hubungan menggunakan edge. Node yang terbentuk akan di kelompokkan ke dalam sejumlah cluster menggunakan algoritma star clustering. Algoritma Star Clustering merupakan salah satu algoritma pengelempokkan graph menjadi subgraph/cluster dengan keterkaitan tertentu. Algoritma star clustering dikenal sebagai algoritma yang mudah digunakan, dan memiliki tingkat akurasi yang cukup baik. Dalam tugas akhir ini didapatkan hasil pengujian penerapan algoritma star clustering pada berita digital dengan tingkat akurasi 80.98% untuk perbandingan dengan clustering expert dan menghasilkan 62.87129% cluster yang baik yaitu cluster yang memiliki nilai intracluster lebih besar daripada intercluster-nya. Kata kunci : graph, graph clustering, star clustering, subgraph
Penerapan Algoritma GRAC (Graph Algorithm Clustering) untuk Graph Database Compression) I Gusti Bagus Ady Sutrisna; Kemas Rahmat Saleh Wiharja; Alfian Akbar Gozali
eProceedings of Engineering Vol 2, No 1 (2015): April, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Graph Database merupakan representasi dari pemodelan suatu koleksi data ke dalam bentuk Node dan Edge. Graph Database adalah salah satu metode implementasi dari NoSQL (Not Only SQL), yaitu sistem database yang berguna untuk penyimpanan data dalam jumlah besar dan direpresentasikan dalam bentuk graph, sehingga data memiliki aksesibilitas yang tinggi. Namun data yang disimpan dalam pemrosesan Graph Database masih belum efisien dalam hal penyimpanan data. Penyimpanan jutaan ataupun milyaran Nodes dan Edges memerlukan pengompresan dalam kebutuhan penyimpanan data. Dalam penelitian ini, kompresi Graph Database yang akan dilakukan adalah dengan menggunakan GRAC(Graph Algorithm Clustering). Graph Database yang digunakan yaitu suatu data yang berisikan data kolaborasi antar penulis jurnal ilmiah. Dalam GRAC(Graph Algorithm Clustering), Clustering yang digunakan adalah Hierarchical Clustering. Metode Hierarchical Clustering adalah suatu metode dalam Clustering yang akan mengcluster Node menjadi bentuk Cluster Node secara hirarki. Dalam pembuatan cluster yang hirarki, strategi yang dipakai adalah Agglomerative dimana setiap Node nantinya akan digabungkan menjadi satu cluster. Untuk mendapatkan strategi Agglomerative yang efektif dan efisien maka akan dihitung jarak maximum antar cluster yang biasa disebut Complete Linkage Clustering. Setiap Node terlebih dahulu dihitung Jaccard indexnya untuk mendapatkan bobot jarak antar Node. Penggunaan Hierarchical Clustering adalah untuk membentuk Cluster Node yang memiliki kesamaan tetangga. Cluster Node nantinya akan dihubungkan dengan Cluster Edge dimana, Cluster Edge didapatkan melalui pencarian secara greedy pada setiap hubungan Cluster Node yang mengabstaksi Edge paling banyak. Dengan menerapkan GRAC (Graph Algorithm Clustering) dengan menggunakan metode Hierarchical Clustering yang membentuk cluster yang hirarki, maka akan menghasilkan graph database yang bersifat lossless serta terkompres dengan baik. Kata Kunci: graph database, compression, graph algorithm clustering, Hierarchical Clustering, agglomerative, complete linkage clustering, jaccard index, greedy, scientific journal authors
Analytical Processing Pada Graph Dataset Dengan Graph Olap Framework Ilham Kamil Noviandi; Kemas Rahmat Saleh Wiharja; Gede Agung Ary Wisudiawan
eProceedings of Engineering Vol 2, No 3 (2015): Desember, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Kehandalan penerapan Online Analytical Processing (OLAP) pada database relasional dalam menangani volume data yang besar. operasi data cube dan operasi-operasi pendukung khas OLAP seperti roll-up, drill-down, slice and dice memberikan multidimensional dan multi-level view yang memudahkan analisis kompleks pada bussiness intelligence, memunculkan banyaknya permintaan penerapan OLAP pada graph database. Graph database itu sendiri telah menjadi tren saat ini karena kemampuannya dalam memproses data yang bersifat struktural dan semi struktural dibandingkan dengan relational database yang menggunakan recursive join sehingga menyebabkan komputasi semakin kompleks. Banyaknya permintaan dan kelebihan dari graph database dalam memodelkan dataset yang berisi informasi terstruktur, maka pada penelitian tugas akhir ini akan menerapkan graph OLAP framework. Graph OLAP framework akan merepresentasikan graph database dalam bentuk snapshots graph dan beberapa operasi-operasi khas OLAP yang memberikan multidimensional dan multi-level view. Kata Kunci: Online Analytical Processing, data, roll-up, drill down, slice and dice, multidimensional, multilevel view, bussiness intelligence, graph database, graph OLAP framework, snapshots
Analisis Pengolahan Text File Pada Hadoop Cluster Dengan Memperhatikan Kapasitas Random Access Memory (ram) Irvan Nur Aziz; Fitriyani Fitriyani; Kemas Rahmat Saleh Wiharja
eProceedings of Engineering Vol 2, No 2 (2015): Agustus, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak Implementasi Hadoop cluster untuk pengolahan data secara terdistribusi dalam skala besar sudah menjadi tren saat ini. Hadirnya hadoop cluster sangat membantu dalam bidang pengolahan data, banyak perusahaan yang mengimplementasikan hadoop cluster seperti facebook, yahoo, dan amazon. Hal ini didasari oleh kelebihan hadoop yang dapat memiliki performansi tinggi dengan menggunakan hardware sederhana. Tujuan dari penelitian ini adalah mengimplementasikan hadoop cluster dengan menggunakan benchmark wordcount sebagai tools untuk mengetahui tingkat performansi dari jenis file text dengan memperhatikan kapasitas Random Access Memory (RAM). Waktu ujicoba yang dihasilkan dari jenis-jenis text file tersebut menunjukan urutan tingkat performansi terbaik dimulai dari jenis text file csv, txt, xlsx, pdf dan yang terakhir adalah jenis file doc. Waktu peningkatan performansi dari semua jenis file tidak mengalami peningkatan yang sama dengan peningkatan kapasitas RAM, pada saat kapasitas RAM ditingkatkan menjadi 100% hasil percobaan menunjukan performansi dari jenis file doc mengalami peningkatan sebesar 4,58%, file pdf sebesar 7,57%, file csv sebesar 8,87%, file xlsx sebesar 8,35% dan file txt sebesar 12,82%. Kata Kunci : Cluster, Hadoop, MapReduce, HDFS, RAM, Bandwidth
Penerapan Metode Association Rule Menggunakan Algoritma Apriori Pada Simulasi Prediksi Hujan Wilayah Kota Bandung Mohammad Fauzy; Kemas Rahmat Saleh; Ibnu Asror
eProceedings of Engineering Vol 2, No 3 (2015): Desember, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak Prakiraan cuaca saat ini telah menjadi satu hal yang dibutuhkan bagi banyak orang di dunia. Dalam memprediksi hujan pengolahan data cuaca merupakan hal yang penting. Namun permasalahannya, data cuaca yang semakin hari semakin bertambah menyebabkan penumpukan data sehingga pengolahan data tersebut perlu penanganan lebih lanjut. Oleh karena itu pemanfaatan data mining digunakan untuk menyelesaikan masalah ini. Association rule mining adalah salah satu metode data mining yang dapat mengidentifikasi hubungan kesamaan antar item. Pada tugas akhir ini akan mencoba menerapkan Association rule mining dengan harapan aturan-aturan asosiatif yang dihasilkan dapat menjadi acuan dalam memprakirakan cuaca. Tugas akhir ini dilakukan dengan tiga tahapan utama yaitu : 1) melakukan analisa pola frekuensi tinggi menggunakan algortima apriori; 2) pembentukan aturan asosiasi (association rule); 3) uji kekuatan rule yang terbentuk dengan menghitung lift ratio pada masing-masing rule. Dataset yang digunakan adalah data klimatologi yang diambil dari BMKG stasiun geofisika kelas 1 Bandung. Hasil akhir dari tugas akhir ini berupa aturan-aturan asosiasi (association rules) dimana aturan-aturan ini dapat dijadikan sebagai acuan dalam memprediksi cuaca hujan atau tidak hujan untuk satu hari kedepan. Kata kunci : data mining, association rule, apriori, prediksi hujan Abstract Weather forecast today has become a necessary thing for many people in the world. In predicting rain weather data processing is essential. But the problem, weather data that is increasingly growing cause the accumulation of data so that the data processing needs further treatment. Therefore, the use of data mining is used to solve this problem. Association rule mining is one of data mining methods that can identify similarity relationships between items. In this final project will try to implement the Association rule mining in hopes of associative rules generated can become a reference in weather forecasting. The final task is performed by three main stages, namely: 1) to analyze high frequency patterns using algorithms priori; 2) the establishment of an association rule (association rule); 3) test the strength of the rule which is formed by calculating the ratio elevator on each rule. The dataset used is the climatological data taken from BMKG station 1st class geophysical Bandung. The end result of this thesis in the form of rules of association (association rules) in which these rules can be used as a reference in predicting the weather is rain or not rain for the next day. Keywords: data mining, association rule, apriori, rain forecast
Analisis Dan Implementasi Graph Indexing Pada Graph Database Menggunakan Algoritma Gindex Hadyan Arif; Kemas Rahmat Saleh Wiharja; Adiwijaya Adiwijaya
eProceedings of Engineering Vol 2, No 2 (2015): Agustus, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak Penggunaan graph dalam memodelkan suatu struktur yang rumit saat ini berkembang secara pesat terutama dalam memodelkan struktur seperti susunan melekul, jaringan protein, dan jaringan sosial. Penggunaan graph database untuk menangani tipe data graph yang memiliki relasi yang kompleks dinilai lebih efektif daripada menggunakan relational database. Dalam mempercepat pemrosesan query pada graph database dibutuhkan suatu metode yang dapat disebut graph indexing agar lebih cepat dan efisien. GIndex merupakan salah satu metode graph indexing yang mendukung pemrosesan query bertipe subgraph query. Pada metode GIndex menerapkan beberapa teknik seperti size-increasing support constraint untuk membangun feature set database dan pemilihan discriminative fragments dalam membangun index. Kemudian membandingkan data pada index dengan feature set query untuk mendapatkan candidate set yang nantinya akan dilakukan subgraph matching menggunakan algoritma Ullman untuk mendapatkan answer set. Pada penelitian ini data yang akan dijadikan sebagai dataset merupakan susunan molekul. Berdasarkan pengerjaan tugas akhir yang telah dilakukan didapatkan hasil bahwa pada pengimplementasian algoritma GIndex, jika menggunakan nilai maximal frequent fragment yang cukup besar maka akan memakan waktu yang lebih lama dan memungkinkan jumlah candidate set yang didapatkan akan lebih sedikit, berlawanan dengan penggunaan nilai minimal discriminative fragment. Banyaknya jumlah candidate set yang didapatkan akan berpengaruh pada waktu subgraph matching yang dibutuhkan. Kata kunci: graph, graph database, GIndex, subgraph query, size-increasing support constraint, discriminative fragments, index, subgraph matching