Jurnal Repositor
Vol 2 No 4 (2020): April 2020

Perbandingan Kinerja Komputasi Hadoop dan Spark untuk Memprediksi Cuaca (Studi Kasus : Storm Event Database)

Rendiyono Wahyu Saputro (Universitas Muhammadiyah Malang)
Aminuddin Aminuddin (Universitas Muhammadiyah Malang)
Yuda Munarko (Universitas Muhammadiyah Malang)



Article Info

Publish Date
05 Mar 2020

Abstract

Perkembangan teknologi telah mengakibatkan pertumbuhan data yang semakin cepat dan besar setiap waktunya. Hal tersebut disebabkan oleh banyaknya sumber data seperti mesin pencari, RFID, catatan transaksi digital, arsip video dan foto, user generated content, internet of things, penelitian ilmiah di berbagai bidang seperti genomika, meteorologi, astronomi, fisika, dll. Selain itu, data - data tersebut memiliki karakteristik yang unik antara satu dengan lainnya, hal ini yang menyebabkan tidak dapat diproses oleh teknologi basis data konvensional. Oleh karena itu, dikembangkan beragam framework komputasi terdistribusi seperti Apache Hadoop dan Apache Spark yang memungkinkan untuk memproses data secara terdistribusi dengan menggunakan gugus komputer.Adanya ragam framework komputasi terdistribusi, sehingga diperlukan sebuah pengujian untuk mengetahui kinerja komputasi keduanya. Pengujian dilakukan dengan memproses dataset dengan beragam ukuran dan dalam gugus komputer dengan jumlah node yang berbeda. Dari semua hasil pengujian, Apache Hadoop memerlukan waktu yang lebih sedikit dibandingkan dengan Apache Spark. Hal tersebut terjadi karena nilai throughput dan throughput/node Apache Hadoop lebih tinggi daripada Apache Spark.

Copyrights © 2020






Journal Info

Abbrev

repositor

Publisher

Subject

Computer Science & IT Engineering

Description

Jurnal Repositor dipublikasikan oleh Universitas Muhammadiyah Malang dan dikelolah Program Studi Informatika. Jurnal Repositor merupakan jurnal ilmiah dengan ruang lingkup keilmuan bidang ifnormatika. Jurnal ini mempublikasikan hasil penelitian, telaah ilmiah dan serangkaian hasil studi yang ...