Francesco Jeremy Topol
Teknik Informatika, Universitas Negeri Manado

Published : 1 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 1 Documents
Search

Penerapan Teknik Google Dorking Untuk Identifikasi Kerentanan Sensitive Data Exposure Menggunakan Google Hacking Database (GHDB) Dengan Metode Focused Crawling: Studi Kasus Situs NASA Francesco Jeremy Topol; Quido C. Kainde; Kristofel Santa
Jurnal Sains Informatika Terapan Vol. 5 No. 2 (2026): Jurnal Sains Informatika Terapan (Juni, 2026)
Publisher : Riset Sinergi Indonesia (RISINDO)

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Di era digital saat ini, kebocoran data sensitif (Sensitive Data Exposure) menjadi ancaman serius bagi integritas organisasi, sering kali disebabkan oleh kesalahan konfigurasi izin akses misalnya studi kasus ini yaitu pada layanan penyimpanan awan seperti Google Drive dan Spreadsheet. Penelitian ini bertujuan untuk merancang dan mengimplementasikan sistem audit keamanan otomatis bernama DorkWatch untuk mengidentifikasi potensi kebocoran data pada domain nasa.gov. Penelitian ini memanfaatkan sumber data primer berupa aset digital yang terindeks pada domain nasa.gov dan subdomain terkait, yang dikumpulkan secara real-time melalui pemanfaatan 5 kueri dork spesifik dari Google Hacking Database (GHDB) yang menargetkan ekosistem Google Workspace. Dalam proses pengujian yang dilakukan, dengan limit 25 hasil pencarian sistem berhasil mengekstraksi dataset yang mencakup tautan layanan penyimpanan awan publik (Google Drive dan Docs) dari konten HTML serta metadata file PDF menggunakan Regular Expression (Regex) dengan metode Focused Crawling. Dataset yang dihasilkan kemudian diklasifikasikan secara otomatis ke dalam 2 kategori utama, yaitu Docs Exposure dan Drive Exposure. Sistem ini dibangun menggunakan bahasa pemrograman Python dengan kerangka kerja Flask, dan menerapkan teknik Google Dorking berbasis Google Hacking Database (GHDB) untuk pencarian dokumen publik dan metode Focused Crawling untuk penelusuran aset digital secara lebih terarah, serta melakukan analisis risiko otomatis berdasarkan validasi status HTTP dan deteksi kata kunci sensitif. Hasil pengujian menunjukkan bahwa sistem DorkWatch efektif dalam menemukan dan mengklasifikasikan aset NASA yang terekspos ke publik, termasuk tautan file Google Docs serta folder dan file Google Drive yang tidak muncul pada hasil pencarian standar, sehingga membuktikan bahwa integrasi metode ini efisien dalam memitigasi risiko kebocoran informasi.