Ekstraksi common fragment dilakukan untuk mendapatkan rangkaian struktur organisasi yang selalu ada dalam setiap Dinas Pendidikan di Jawa Timur. Common fragment didapatkan melalui serangkaian proses berdasarkan pada kemiripanstruktur organisasi. Struktur organisasi dapat diukur kemiripannya dengan tiga tahapan, yaitu kemiripan sintaktik, kemiripan semantik, dan kemiripan struktural. Tahapan pertama megnhitung kemiripan sintaktik dengan nilai kemiripan sebesar 100%. Tahap kedua menghitung kemiripan semantik dengan threshold 80%, pada tahapan tersebut tidak ada yang memenuhi untuk batas threshold. Sehingga, pada tahapan tearkhir dihitung tingkat kemiripan struktural berdasarkan tingkat kemiripan sintaktik. Dari setiap tahapan tersebut akhirnya didapatkan common fragment untuk struktur organisasi Dinas Pendidikan di Jawa Timur.