Claim Missing Document
Check
Articles

Found 19 Documents
Search
Journal : eProceedings of Engineering

Analisis Pengolahan Text File Pada Hadoop Cluster Dengan Memperhatikan Kapasitas Random Access Memory (ram) Irvan Nur Aziz; Fitriyani Fitriyani; Kemas Rahmat Saleh Wiharja
eProceedings of Engineering Vol 2, No 2 (2015): Agustus, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak Implementasi Hadoop cluster untuk pengolahan data secara terdistribusi dalam skala besar sudah menjadi tren saat ini. Hadirnya hadoop cluster sangat membantu dalam bidang pengolahan data, banyak perusahaan yang mengimplementasikan hadoop cluster seperti facebook, yahoo, dan amazon. Hal ini didasari oleh kelebihan hadoop yang dapat memiliki performansi tinggi dengan menggunakan hardware sederhana. Tujuan dari penelitian ini adalah mengimplementasikan hadoop cluster dengan menggunakan benchmark wordcount sebagai tools untuk mengetahui tingkat performansi dari jenis file text dengan memperhatikan kapasitas Random Access Memory (RAM). Waktu ujicoba yang dihasilkan dari jenis-jenis text file tersebut menunjukan urutan tingkat performansi terbaik dimulai dari jenis text file csv, txt, xlsx, pdf dan yang terakhir adalah jenis file doc. Waktu peningkatan performansi dari semua jenis file tidak mengalami peningkatan yang sama dengan peningkatan kapasitas RAM, pada saat kapasitas RAM ditingkatkan menjadi 100% hasil percobaan menunjukan performansi dari jenis file doc mengalami peningkatan sebesar 4,58%, file pdf sebesar 7,57%, file csv sebesar 8,87%, file xlsx sebesar 8,35% dan file txt sebesar 12,82%. Kata Kunci : Cluster, Hadoop, MapReduce, HDFS, RAM, Bandwidth
Penerapan Metode Association Rule Menggunakan Algoritma Apriori Pada Simulasi Prediksi Hujan Wilayah Kota Bandung Mohammad Fauzy; Kemas Rahmat Saleh; Ibnu Asror
eProceedings of Engineering Vol 2, No 3 (2015): Desember, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak Prakiraan cuaca saat ini telah menjadi satu hal yang dibutuhkan bagi banyak orang di dunia. Dalam memprediksi hujan pengolahan data cuaca merupakan hal yang penting. Namun permasalahannya, data cuaca yang semakin hari semakin bertambah menyebabkan penumpukan data sehingga pengolahan data tersebut perlu penanganan lebih lanjut. Oleh karena itu pemanfaatan data mining digunakan untuk menyelesaikan masalah ini. Association rule mining adalah salah satu metode data mining yang dapat mengidentifikasi hubungan kesamaan antar item. Pada tugas akhir ini akan mencoba menerapkan Association rule mining dengan harapan aturan-aturan asosiatif yang dihasilkan dapat menjadi acuan dalam memprakirakan cuaca. Tugas akhir ini dilakukan dengan tiga tahapan utama yaitu : 1) melakukan analisa pola frekuensi tinggi menggunakan algortima apriori; 2) pembentukan aturan asosiasi (association rule); 3) uji kekuatan rule yang terbentuk dengan menghitung lift ratio pada masing-masing rule. Dataset yang digunakan adalah data klimatologi yang diambil dari BMKG stasiun geofisika kelas 1 Bandung. Hasil akhir dari tugas akhir ini berupa aturan-aturan asosiasi (association rules) dimana aturan-aturan ini dapat dijadikan sebagai acuan dalam memprediksi cuaca hujan atau tidak hujan untuk satu hari kedepan. Kata kunci : data mining, association rule, apriori, prediksi hujan Abstract Weather forecast today has become a necessary thing for many people in the world. In predicting rain weather data processing is essential. But the problem, weather data that is increasingly growing cause the accumulation of data so that the data processing needs further treatment. Therefore, the use of data mining is used to solve this problem. Association rule mining is one of data mining methods that can identify similarity relationships between items. In this final project will try to implement the Association rule mining in hopes of associative rules generated can become a reference in weather forecasting. The final task is performed by three main stages, namely: 1) to analyze high frequency patterns using algorithms priori; 2) the establishment of an association rule (association rule); 3) test the strength of the rule which is formed by calculating the ratio elevator on each rule. The dataset used is the climatological data taken from BMKG station 1st class geophysical Bandung. The end result of this thesis in the form of rules of association (association rules) in which these rules can be used as a reference in predicting the weather is rain or not rain for the next day. Keywords: data mining, association rule, apriori, rain forecast
Analisis Dan Implementasi Graph Indexing Pada Graph Database Menggunakan Algoritma Gindex Hadyan Arif; Kemas Rahmat Saleh Wiharja; Adiwijaya Adiwijaya
eProceedings of Engineering Vol 2, No 2 (2015): Agustus, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak Penggunaan graph dalam memodelkan suatu struktur yang rumit saat ini berkembang secara pesat terutama dalam memodelkan struktur seperti susunan melekul, jaringan protein, dan jaringan sosial. Penggunaan graph database untuk menangani tipe data graph yang memiliki relasi yang kompleks dinilai lebih efektif daripada menggunakan relational database. Dalam mempercepat pemrosesan query pada graph database dibutuhkan suatu metode yang dapat disebut graph indexing agar lebih cepat dan efisien. GIndex merupakan salah satu metode graph indexing yang mendukung pemrosesan query bertipe subgraph query. Pada metode GIndex menerapkan beberapa teknik seperti size-increasing support constraint untuk membangun feature set database dan pemilihan discriminative fragments dalam membangun index. Kemudian membandingkan data pada index dengan feature set query untuk mendapatkan candidate set yang nantinya akan dilakukan subgraph matching menggunakan algoritma Ullman untuk mendapatkan answer set. Pada penelitian ini data yang akan dijadikan sebagai dataset merupakan susunan molekul. Berdasarkan pengerjaan tugas akhir yang telah dilakukan didapatkan hasil bahwa pada pengimplementasian algoritma GIndex, jika menggunakan nilai maximal frequent fragment yang cukup besar maka akan memakan waktu yang lebih lama dan memungkinkan jumlah candidate set yang didapatkan akan lebih sedikit, berlawanan dengan penggunaan nilai minimal discriminative fragment. Banyaknya jumlah candidate set yang didapatkan akan berpengaruh pada waktu subgraph matching yang dibutuhkan. Kata kunci: graph, graph database, GIndex, subgraph query, size-increasing support constraint, discriminative fragments, index, subgraph matching
Analisis Sub-graph Query Pada Jaringan Komunikasi Data Email Dengan Pendekatan Graphrel Ludovica Gorganusa; Kemas Rahmat Saleh Wiharja
eProceedings of Engineering Vol 2, No 3 (2015): Desember, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Graph database adalah alat pemodelan data yang bersifat sederhana sampai kompleks. Dengan berisikan node dan edge, suatu data dapat dimodelkan untuk memudahkan analisis suatu proses dalam bentuk query. Graph database lebih unggul daripada relational database karena bisa menangani data yang tidak terstruktur dan semi terstruktur. Pemodelan data kedalam bentuk graph bisa bermacam-macam. Misalnya saja kasus email, yang sifatnya dalam skala besar dan dinamis. Satu alamat email bisa menampung ribuan email dari ratusan pengguna email dengan alamat email berbeda. Tentu database yang disajikan akan memakan banyak tabel dengan atribut yang sama, hanya isinya yang berbeda. Untuk satu alamat tujuan perlu dibentuk satu tabel baru yang menampung data email komunikasi antar pengguna. Lain halnya dengan menggunakan pemodelan dengan graph database. Dari kasus tersebut memerlukan pendekatan sebuah framework relational yang berbasis dekomposisi dan Selektivitas-Aware untuk pengolahan sub-graph query, yaitu graphREL. Dengan berbasis dekomposisi, graphREL bisa menerapkan konsep B-Tree yang biasa hanya dipakai dalam pemodelan relational database.. Kata kunci : graph database, email, framework relational, berbasis dekomposisi, selectivityaware, graphREL, B-Tree
Analisis Aspek Behavioral Pada Business Process Model And Notation Menggunakan Causal Footprints Donny Faturrachman; Dana Sulistiyo Kusumo; Kemas Rahmat Saleh Wiharja
eProceedings of Engineering Vol 2, No 3 (2015): Desember, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Dari sekian banyaknya model proses bisnis dapat menimbulkan masalah baru seperti model proses bisnis yang dibuat mengalami duplikasi antara satu model proses bisnis dengan yang lainnya sehingga menyebabkan repository menjadi penuh atau menjadi keberagaman pada model proses bisnis. Dalam mengatasi masalah tersebut salah satu cara adalah dengan menganalisis similarity (kemiripan) antara model proses bisnis. Analisis tingkat kesamaan proses bisnis sangat diperlukan dalam penyederhanaan dan penyatuan berbagai proses bisnis yang ada. Analisis dilakukan pada aspek behavioral, karena behavioral similarity memiliki kelebihan daripada label dan structural similarity dimana pada saat melakukan pengukuran similiarity, memperhatikan relasi tidak langsung sehingga perhitungan similarity yang didapat tidak mengalami penurunan. Metode yang digunakan adalah Causal Footprints, sebuah graph untuk mereprentasikan behavior antara dua node dari suatu model proses bisnis, dinamakan look-back links dan look-ahead links. Untuk mendukung proses similarity perlu ditunjang oleh bahasa pemodelan proses yang memiliki activity nodes dan control nodes seperti Business Process Model and Notation (BPMN) juga memiliki format struktur data XML. Pengujian dilakukan dengan menggunakan tiga model BPMN yang dibandingkan sebagai query dan variant. Berdasarkan hasil pengujian, similarity BPMN pertama  terhadap BPMN kedua sebesar 63 % begitu juga sebaliknya, BPMN kedua terhadap BPMN ketiga sebesar 75 % begitu juga sebaliknya, dan BPMN pertama terhadap BPMN ketiga sebesar 74 % begitu juga sebaliknya. Faktor yang mempengaruhi nilai similarity adalah jumlah node, pertukaran BPMN sebagai query dengan variant, intersection dan link. Kata Kunci : BPMN, behavioral similarity, causal footprints, syntactic similarity.
Analisa Dan Implementasi Graph Summarization Dengan Metode Canal Wisnu Riyan Pratama Putra; Kemas Rahmat Saleh Wiharja; Alfian Akbar Gozali
eProceedings of Engineering Vol 2, No 2 (2015): Agustus, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstract— Pemodelan data menggunakan graph telah diterapkan oleh banyak aplikasi dan sistem berskala besar dalam berbagai bidang. Data tersebut direpresentasikan sebagai graph dengan node yang mewakili sebuah objek dan edge menandakan hubungan antara dua objek. Untuk memahami karakteristik graph, maka dibutuhkan teknik graph summarization. Pada penelitian ini digunakan metode CANAL (Categorization of Attributes with Numerical Values based on Attribute Values and Link Structures of Nodes) untuk meringkas graph. Metode ini merupakan pengembangan dari metode Aggregation-Based Graph Summarization yang melakukan peringkasan dengan mengelompokkan serta menggabung node kedalam sebuah super node kemudian mengggali pengetahuan dari data untuk menemukan cutoff yang digunakan dalam pengelompokan node secara otomatis. Metode CANAL memperbaiki metode graph summarization SNAP dan k-SNAP yang masih mempunyai kelemahan dalam menangani data dengan atribut numerik[2]. Kedua metode tersebut hanya dapat menangani categorical node attribute, sehingga ketika dihadapkan dengan atribut numerik pengguna masih harus melakukan pengelompokan secara manual berdasarkan pengetahuan mereka terhadap data yang digunakan. Hasil dari sistem yang akan dibangun merupakan sebuah graph summary yang merepresentasikan pattern hubungan antar kelompok dalam ringkasan. Pattern tersebut dapat digunakan untuk membantu memahami informasi yang tersembunyi didalam graph asli. Dari summary yang dihasilkan oleh metode CANAL kemudian dinilai kualitasnya dan dibandingkan dengan kualitas summary dengan cutoff manual. Perbandingan tersebut menunjukkan bahwa kualitas summary dari CANAL memiliki kualitas baik yang setara dengan kualitas summary dengan cutoff manual. Keywords—graph summarization, Aggregation-Based Graph Summarization, node attribute, link structure, interestingness measure.
Implementasi Prinsip MDL untuk Kompresi Graph Database Menggunakan Algoritma Greedy Harris Febryantony Z; Kemas Rahmat Saleh Wiharja; Alfian Akbar Gozali
eProceedings of Engineering Vol 2, No 1 (2015): April, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Graph secara konsep merupakan abstraksi yang secara fundamental telah lama dipakai, yang memungkinkan untuk memodelkan pada sistem di dunia nyata. Begitu pula pada data, data jenis apapun dapat dimodelkan relasi antar data tersebut menggunakan graph. Graph database diadopsi untuk memudahkan dan membantu dalam memahami, memodelkan, serta menganalisis suatu proses. Graph database sangat cocok digunakan pada data bersifat tidak terstruktur dan semi terstruktur dibanding relational database yang mana memiliki kelemahan jika data dan ukuran tabel bertambah menyebabkan kemungkinan join antar tabel sangat besar. Dalam aplikasinya jumlah data pada graph database semakin lama akan berkembang semakin besar menjadi jutaan bahkan miliaran node dan edge, sehingga cost untuk untuk melakukan analisa dan visualisasi graph databse menjadi sangat besar untuk kemampuan sistem saat ini. Untuk menyelesaikan permasalahan tersebut maka diperlukan suatu metode untuk mengurangi ukuran dari graph tetapi tetap menyimpan informasi-informasi penting dari graph. Dengan menerapkan prinsip Rissaenen’s Minimum Description Length (MDL) dan melakukan penggabungan secara greedy serta mengombinasikan dengan representasi graph G yang terdiri dari Graph Summary dan sebuah set Correction, maka dapat dihasilkan graph database yang dikompres dengan baik. Kata Kunci: graph database, graph summarization, graph representation, MDL principle, lossles, lossy, compression, greedy, Rissaenen’s Minimum Description Length
Implementasi Dan Analisis Visualisasi Graph Pada Graph Statis Menggunakan Representasi Visual Treemap Lukman Arie Susanto; Kemas Rahmat Saleh Wiharja; Shinta Yulia Puspitasari
eProceedings of Engineering Vol 2, No 3 (2015): Desember, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Implementasi graph dapat diterapkan di bidang sosial network, transportasi, biokimia, dan lain-lain. Visualisasi graph pada media sosial menghubungkan antar orang untuk saling bertukar informasi. Pada bidang transportasi menggambarkan jalur atau jalan dengan tempat tertentu sebagai node atau titik. Permasalahan yang timbul jika data tersebut sangat besar maka akan menimbulkan masalah dalam hal visualisasi graph tersebut. Tampilan graph yang besar mempengaruhi pengguna menjadi tidak dapat membaca dan memahami data-data pada visualisasi graph. Selain itu karena data yang besar membuat node-node dan sisi saling overlap dan menggunakan ruang tampilan yang besar. Implementasi treemap pada tugas akhir ini adalah menggunakan data graph berarah dengan konten dataset social network wiki vote. Selain itu juga output yang ditampilkan yaitu berupa visualisasi treemap 2D. Implementasi treemap ini juga dapat berinteraksi dengan user untuk melihat hubungan antar node. Hasil yang diperoleh dari penelitian ini adalah bahwa dengan menggunakan data graph berarah, maka data yang tampil pada visualisasi lebih banyak daripada jumlah dari dataset. Selain itu juga visualisasi treemap ini efektif karena user dapat melihat node yang dipilih terhubung ke node mana saja. Tetapi kekurangan yang didapat adalah bahwa user terlebih dahulu harus mencari node yang ingin dipilih sehingga hal ini menjadi tidak efisien karena membutuhkan waktu yang lebih banyak. Penelitian yang akan datang diharapkan dapat menggunakan visualisasi graph dengan representasi visual yang lain selain treemap dan juga menggunakan graph yang dinamis. Kata kunci : graph berarah, treemap, visualisasi
Visualisasi Al- Qur’an Berbasis Knowledge graph dengan Ayat Sebagai Vertex Ayuningtyas, Shinta Cyntia; Wiharja, Kemas Rahmat Saleh; Nhita, Fhira
eProceedings of Engineering Vol. 10 No. 3 (2023): Juni 2023
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak-Al- Qur’an merupakan sumber utama ajaran agama islam yang memiliki derajat keterkaitan yang sangat tinggi diantara ayat-ayatnya. Cara yang paling natural untuk menyajikan keterkaitan antara ayat ini adalah dengan menyajikan Al-Qur’an dalam format knowledge graph. Penelitianini akan mencoba menyajikan Al-Qur’an dalam format Knowledge graph dengan setiap ayat yang akan dijadikan sebagai node dan hubungan antar setiap ayat yang dijadikan relasi (busur) pada Knowledge graph. Sebelumnya sudah ada penelitian yang menyajikan Al- Qur’an dalam bentuk Knowledge graph dengan menggunakan Neo4j yang berjudul ‘Visualisasi Tematik Al- Qur’an berbasis Knowledge Graph’. Berbeda dengan penelitian sebelumnya pada penelitian ini akan digunakan TigerGraph untuk proses penyajian knowledge graph. Pada proses pengujian dilakukan 2 tahap yaitu membandingkan antara penelitian ini dengan penelitian sebelumnya dalam hal kelengkapan keterhubungan ayat yang dihasilkan. dan melibatkan penguji (ahli Al - Qur’an) untuk menguji kelengkapan keterhubungan ayat yang dihasilkan. Hasil yang didapatkan dari penelitian ini adalah pada pengujian tipe pertama data yang dapat dimunculkan oleh sistem ini memiliki hasil tema yang lebih lengkap daripada penelitian sebelumnya karena menggunakan dataset yang berbeda. Pada pengujian tipe kedua memiliki hasil keterkaitan yang berbeda saat divalidasi oleh penguji dikarenakan data yang dihasilkan sesuai dengan data yang berasal dari sumber dataset, perbedaan hasil keterkaitan ini dikarenakan adanya beberapa perbedaan pendefinisian kata atau kalimat tertentu dari pengertian bahasa arab saat diterjemahkan kedalambahasa indonesia.Kata kunci -Al – Qur’an , knowledge graph , visualisasi tematik ,tigergraph.