Data mining merupakan sebuah proses penggalian atau penemuan informasi baru dengan mencari pola tertentu dari sejumlah besar database yang telah tersedia. Teknik ini dapat membantu dalam pemanfaatan kembali data tersebut. Penelitian ini bermaksud melakukan penggalian informasi terhadap data absensi online di Perguruan Tinggi Raharja. Penggalian informasi dilakukan untuk meramalkan tingkat kedisiplinan mahasiswa. Penelitian ini bertujuan untuk mendapatkan set data yang berkualitas dan siap untuk dilakukan proses data mining untuk digunakan dalam proses peramalan tingkat kedisiplinan mahasiswa. Penelitian ini dilakukan dengan tahapan melakukan preprocessing data yang tediri dari pembersihan, ekstraksi, transformasi data, dan pemilihan atribut. Preprocessing dilakukan terhadap set data absensi online semester genap 2014/2015 dan set data induk mahasiswa. Hasil preprocessing mendapatkan, 1.836 record mahasiswa. Setiap record berisi variabel y sebagai atribut target yaitu kedisiplinan mahasiswa, dan 8 variabel x sebagai atribut prediktor yang diasumsikan memiliki pengaruh terhadap variabel y. Kata Kunci: Data mining, preprocessing, peramalan, tingkat kedisiplinan mahasiswa