Jurnal Informatika dan Rekayasa Perangkat Lunak
Vol 6, No 2 (2024): September

Model Hybrid Random Forest dan Information Gain untuk Meningkatkan Performa Algoritma Machine Learning pada Deteksi Malicious Software

Rafrastara, Fauzi Adi (Unknown)
Ghozi, Wildanil (Unknown)
Sani, Ramadhan Rakhmat (Unknown)
Handoko, L. Budi (Unknown)



Article Info

Publish Date
30 Sep 2024

Abstract

Evolusi malware atau perangkat lunak berbahaya semakin meningkatkan kekhawatiran, menyerang tidak hanya komputer tetapi juga perangkat lain seperti smartphone. Malware kini tidak hanya berbentuk monomorfik, tetapi telah berkembang menjadi bentuk polimorfik, metamorfik, hingga oligomorfik. Dengan perkembangan massif ini, perangkat lunak antivirus konvensional tidak akan mampu mengatasinya dengan baik. Hal ini disebabkan oleh kemampuan malware untuk menyebarkan dirinya dengan pola sidik jari dan perilaku yang berbeda. Oleh karena itu, diperlukan antivirus cerdas berbasis machine learning yang mampu mendeteksi malware berdasarkan perilaku bukan sidik jari. Penelitian ini berfokus pada implementasi model machine learning dalam deteksi malware dengan menggunakan algoritma ensemble dan seleksi fitur untuk mencapai kinerja yang baik. Algoritma ensemble yang digunakan adalah Random Forest, dievaluasi dan dibandingkan dengan k-Nearest Neighbor dan Decision Tree sebagai state-of-the-art. Untuk meningkatkan kinerja klasifikasi dalam hal kecepatan proses, metode seleksi fitur yang diterapkan adalah Information Gain dengan 22 fitur. Hasil tertinggi dicapai dengan menggunakan algoritma Random Forest dan metode seleksi fitur Information Gain, mencapai skor 99.0% untuk akurasi dan F1-Score. Dengan mengurangi jumlah fitur, kecepatan pemrosesan dapat ditingkatkan hingga hampir 5 kali lipat.

Copyrights © 2024






Journal Info

Abbrev

JINRPL

Publisher

Subject

Computer Science & IT

Description

Journal of Informatics and Software Engineering accepts scientific articles in the focus of Informatics. The scope can be: Software Engineering, Information Systems, Artificial Intelligence, Computer Based Learning, Computer Networking and Data Communication, and ...