Perkembangan teknologi informasi yang pesat telah menyebabkan ledakan data dalam berbagai bentuk dan ukuran, yang dikenal sebagai fenomena Big Data. Dalam konteks ini, Data Science menjadi pendekatan utama untuk mengolah dan menganalisis data, namun keberagaman tipe dan format data masih menjadi tantangan utama. Meskipun telah banyak penelitian yang membahas pengolahan data secara teknis, kajian komprehensif yang mengklasifikasikan tipe dan format data dalam perspektif Big Data dan Data Science masih terbatas. Oleh karena itu, penelitian ini bertujuan untuk mengidentifikasi dan mengklasifikasikan tipe serta format data yang sering digunakan dalam bidang tersebut. Penelitian ini menggunakan pendekatan studi literatur (library research) terhadap berbagai jurnal ilmiah dan referensi akademik lainnya. Hasil penelitian menunjukkan bahwa data dalam konteks Big Data dapat diklasifikasikan ke dalam tiga tipe utama, yaitu data terstruktur, semi-terstruktur, dan tidak terstruktur. Selain itu, ditemukan berbagai format data yang digunakan sesuai kebutuhan penyimpanan dan pemrosesan, seperti CSV, JSON, XML, Avro, Parquet, dan lainnya. Pemilihan format ini berpengaruh langsung terhadap efisiensi proses analitik, interoperabilitas sistem, dan pengelolaan data skala besar. Penelitian ini menyadari adanya batasan berupa keterbatasan cakupan literatur serta belum adanya validasi empiris dalam praktik industri. Namun demikian, hasil kajian ini memberikan kontribusi awal bagi pengembangan kerangka kerja klasifikasi data serta menjadi referensi konseptual bagi peneliti dan praktisi. Implikasi penelitian ini juga membuka peluang eksplorasi lebih lanjut terhadap pemanfaatan dan optimalisasi format data dalam berbagai sektor berbasis data.
Copyrights © 2025