JUTI: Jurnal Ilmiah Teknologi Informasi
Vol 1, No 1 Juli 2002

PEMBANGKIT DATA OTOMATIS BERBASIS POLA DISTRIBUSI POISSON UNTUK KEBUTUHAN PENGETESAN PERANGKAT LUNAK DATA MINING DALAM PENCARIAN POLA ASOSIASI DAN POLA SEKUENSIAL

Djunaidy, Arif (Unknown)
Soelaiman, Rully (Unknown)
Pratiwi, Adhita (Unknown)



Article Info

Publish Date
01 Jul 2002

Abstract

Data transaksi tiruan yang menyerupai transaksi nyata pada lingkungan ritel dibutuhkan dalam pengetesan teknik data mining untuk pencarian pola asosiasi dan pola sekuensial dari basis data berskala besar. Dalamdunia nyata, terdapat kecenderungan bahwa pembeli melakukan pembelian beberapa item secara bersamaan dengan ukuran transaksi terkelompok di sekitar nilai rerata banyaknya item yang dibeli dan membentuk poladistribusi Poisson. Makalah ini membahas pengembangan pembangkit data otomatis yang mengikuti pola distribusi Poisson untuk kebutuhan pengetesan perangkat lunak data mining dalam pencarian pola asosiasi dan pola sekuensial.Dalam proses pembangkitan data, perangkat lunak ini menggunakan beberapa parameter, seperti jumlah item, ukuran rerata itemset, ukuran maksimum large itemset, jumlah large itemset, ukuran rerata transaksi, ukuranmaksimum transaksi, dan jumlah transaksi. Sedang tahapan pembuatan transaksi tiruan meliputi pembentukan item yang akan dimasukkan ke dalam transaksi, pembuatan large itemset dari kumpulan item, dan pembuatantransaksi. Ukuran masing-masing itemset dan transaksi didasarkan pada pola distribusi Poisson dengan rerata sama dengan ukuran rerata large itemset/transaksi.Uji coba perangkat lunak yang dilakukan terhadap berbagai nilai parameter membuktikan bahwa pembangkit data otomatis mampu menghasilkan data transaksi tiruan dalam jumlah besar dengan waktukomputasi yang relatif singkat. Hasil uji coba menunjukkan bahwa (a) semakin besar ukuran rerata transaksi, semakin besar pula jumlah record, waktu pembuatan dataset, ukuran basis data, dan jumlah frequent itemsetyang ditemukan, (b) semakin besar jumlah transaksi, semakin besar pula jumlah record, waktu pembuatan dataset, dan ukuran basis data yang dihasilkan, dan (c) semakin besar jumlah itemset yang dibuat, semakinsedikit jumlah pola yang ditemukan. Kata kunci: pembangkit data otomatis, pola distribusi poisson, data mining, pola asosiasi, pola sekuensial.

Copyrights © 2002