Jurnal Sains Informatika Terapan (JSIT)
Vol. 5 No. 2 (2026): Jurnal Sains Informatika Terapan (Juni, 2026)

Penerapan Teknik Google Dorking Untuk Identifikasi Kerentanan Sensitive Data Exposure Menggunakan Google Hacking Database (GHDB) Dengan Metode Focused Crawling: Studi Kasus Situs NASA

Francesco Jeremy Topol (Teknik Informatika, Universitas Negeri Manado)
Quido C. Kainde (Universitas Negeri Manado)
Kristofel Santa (Universitas Negeri Manado)



Article Info

Publish Date
01 Jun 2026

Abstract

Di era digital saat ini, kebocoran data sensitif (Sensitive Data Exposure) menjadi ancaman serius bagi integritas organisasi, sering kali disebabkan oleh kesalahan konfigurasi izin akses misalnya studi kasus ini yaitu pada layanan penyimpanan awan seperti Google Drive dan Spreadsheet. Penelitian ini bertujuan untuk merancang dan mengimplementasikan sistem audit keamanan otomatis bernama DorkWatch untuk mengidentifikasi potensi kebocoran data pada domain nasa.gov. Penelitian ini memanfaatkan sumber data primer berupa aset digital yang terindeks pada domain nasa.gov dan subdomain terkait, yang dikumpulkan secara real-time melalui pemanfaatan 5 kueri dork spesifik dari Google Hacking Database (GHDB) yang menargetkan ekosistem Google Workspace. Dalam proses pengujian yang dilakukan, dengan limit 25 hasil pencarian sistem berhasil mengekstraksi dataset yang mencakup tautan layanan penyimpanan awan publik (Google Drive dan Docs) dari konten HTML serta metadata file PDF menggunakan Regular Expression (Regex) dengan metode Focused Crawling. Dataset yang dihasilkan kemudian diklasifikasikan secara otomatis ke dalam 2 kategori utama, yaitu Docs Exposure dan Drive Exposure. Sistem ini dibangun menggunakan bahasa pemrograman Python dengan kerangka kerja Flask, dan menerapkan teknik Google Dorking berbasis Google Hacking Database (GHDB) untuk pencarian dokumen publik dan metode Focused Crawling untuk penelusuran aset digital secara lebih terarah, serta melakukan analisis risiko otomatis berdasarkan validasi status HTTP dan deteksi kata kunci sensitif. Hasil pengujian menunjukkan bahwa sistem DorkWatch efektif dalam menemukan dan mengklasifikasikan aset NASA yang terekspos ke publik, termasuk tautan file Google Docs serta folder dan file Google Drive yang tidak muncul pada hasil pencarian standar, sehingga membuktikan bahwa integrasi metode ini efisien dalam memitigasi risiko kebocoran informasi.

Copyrights © 2026






Journal Info

Abbrev

jsit

Publisher

Subject

Computer Science & IT Control & Systems Engineering Electrical & Electronics Engineering

Description

The scope of this journal is all about Computer Science that are: 1. Artificial Intelligence 2. Computer System 3. Data Mining 4. Information System 5. Decision Support System (DSS) ...