AbstrakInformasi yang tersedia pada halaman-halaman web trunojoyo.ac.id semakin besar, belum tertata dengan baik, belum terstruktur atau terkategori mengikuti kaidah tertentu dan tersebar pada banyak sub-domain. Sejauh ini, tidak ada gerbangatau portal web yang menyediakan akses ke berbagai situs webyang dihosting oleh data center PTIK Universitas Trunojoyo. Salah satu masalah yang telah diselesaikan adalah pengelompokan informasi atau berita web tersebut secara otomatis menggunakan algoritma clustering K-Means. Search engine RISE yang telah berjalan menghimpun semua halaman web yang ditulis dalam bahasa Indonesia di bawah domain trunojoyo.ac.id menggunakan teknik crawling. Halaman-halaman tersebut kemudian dipre-processing menggunakan teknik standar dalam text minig (informationm retrieval). Proses utamanya adalah penerapan teknik k-menas sehingga terbentuk kelompok berita otonom. Pengujian yang telah dilakukan menunjukkan bahwa teknik clustering yang diterapkan mampu bekerja dengan baik dan memberikan akurasi yang memuaskan. Ada sekitar 300 halaman web yang dilibatkan dalam proses clustering dimana diperoleh ukuran rata-rata F-Measure sebesar 0.6129192 dan Purity bernilai 0.67294195. Faktor yang cukup berpengaruh dalam clustering dan klasifikasi teks bahasa Indonesia adalah fase pre-processing, terutama pada pendekatan stemming. Perbaikan terhadap teknik stemming diyakini akan meningkatkan akurasi pengelompokan dokumen.Kata Kunci : Clustering, K-Means, F-Measure, PurityAbstractThe information available on the web pages trunojoyo.ac.id getting bigger, not well ordered, yet structured or terkategori follow certain rules and scattered in many subdomains. So far, no gerbangatau web portal that provides access to a variety of sites hosted by the data center webyang PTIK Trunojoyo University. One problem that has been solved is the grouping of information or news Web site automatically using the KMeans clustering algorithm. RISE search engines that have been running together all the web pages are written in Indonesian under trunojoyo.ac.id domain using crawling techniques. The pages are then dipre-processing using standard techniques in text Minig (informationm retrieval). The main process is the application of K-menas technique to form groups of autonomous news. Tests have shown that the clustering technique appliedis able to work well and give satisfactory accuracy. There are about 300 web pages that are involved in the process of clustering which gained an average size of F-Measure 0.67294195 and Purity 0.6129192. Factors influential in clustering and classification Indonesian text is pre-processing phase, especially on the stemming approach. Repairs to stemming technique is believed to improve the accuracy of the document grouping.Keywords : Clustering, K-Means, F-Measure, Purity