Serangan siber terhadap aplikasi web terus meningkat seiring ketergantungan institusi pada layanan digital. Log server web merupakan sumber bukti digital vital yang merekam jejak aktivitas, namun analisis manual terhadap jutaan baris log sering kali tidak efektif dan rentan kesalahan. Penelitian ini bertujuan mengembangkan alat bantu investigasi otomatis menggunakan metode Unsupervised Learning. Sistem yang dibangun menerapkan algoritma Agglomerative Clustering untuk mengelompokkan pola serangan. Tantangan utama dalam klasterisasi log adalah representasi data teks URL yang tidak terstruktur. Oleh karena itu, penelitian ini mengusulkan ekstraksi fitur hibrida yang menggabungkan fitur berbasis aturan dari Sigma Rules dan fitur semantik menggunakan model SBERT all-MiniLM-L6-v2. Berdasarkan hasil pengujian hyperparameter tuning pada rentang k=10 hingga k=15, metode Average Linkage dengan jumlah klaster (k) 12 terbukti memberikan hasil paling optimal. Evaluasi eksternal menunjukkan nilai Homogeneity Score sebesar 0,992 dan Completeness Score sebesar 0,309. Tingginya homogenitas membuktikan kemampuan sistem dalam memisahkan aktivitas normal dan anomali dengan kemurnian tinggi, sementara granularitas klaster yang terbentuk mampu memisahkan varian serangan spesifik seperti SQL Injection dan Sensitive File Exposure untuk mempermudah analisis serangan siber.
Copyrights © 2026