Deteksi phishing link merupakan tantangan kritis dalam keamanan siber yang memerlukan teknik analisis canggih untuk membedakan antara link sah (legitimate link) dan link berbahaya (phishing link). Hal ini perlu dilakukan karena seiring dengan perkembangan teknologi, ancaman phishing semakin kompleks dan sulit dikenali, sehingga tidak hanya dapat menyebabkan kerugian finansial, tetapi juga dapat merusak reputasi organisasi dan menimbulkan kerentanan lebih lanjut terhadap serangan siber lainnya. Dengan peningkatan kompleksitas serangan phishing, pendekatan konvesional tidak lagi cukup efektif, oleh karena itu, diperlukan teknik yang lebih adaptif seperti machine learning untuk mengenali pola-pola dalam link yang menunjukkan potensi ancaman. Penelitian ini bertujuan untuk mendeteksi dini phishing link menggunakan algoritma machine learning dengan menganalisis pengaruh penggunaan feature engineering dengan membandingkan performa algoritma berbasis bagging dan boosting. Dalam penelitian ini, kami mengembangkan fitur baru ('Count_/_Path' dan 'path_length') yang merupakan hasil ekstraksi dari fitur yang sudah ada dan mengevaluasinya menggunakan pehitungan nilai Mutual Information untuk meningkatkan akurasi model. Hasil penelitian menunjukkan bahwa penambahan fitur 'Count_/_Path' dan 'path_length' secara signifikan meningkatkan kinerja model. Selain itu, kami membandingkan tiga algoritma machine learning, yaitu Random Forest, Gradient Boosting, dan XGBoost. Dari hasil perbandingan, algoritma XGBoost dengan penambahan fitur menunjukkan performa terbaik dengan akurasi 92%, recall 94%, dan presisi 91%. Dimana Random Forest hanya penghasilkan akurasi 91%, recall 92%, presisi 90% dan Gradient Boosing hanya menghasilkan akurasi 90%, recall 93%, presisi 88%.
Copyrights © 2024