Kemajuan teknologi yang sangat cepat mendorong manusia dalam memanfaatkan tumbuh kembangnya teknologitersebut untuk melakukan pekerjaan yang dahulu dikerjakan secara manual. Teknik yang digunakan untukmemecahkan masalah adalah dengan menggunakan teknik text mining untuk pengkategorian dokumen penulisanilmiah. Sedangkan untuk mencari nilai similaritas suatu dokumen dengan dokumen lainnya menggunakan kata kunciyang didapat dari hasil pengkategorian dokumen dan algoritma yang digunakan adalah algoritma TF-IDF (TermFrequency – Inversed Document Frequency), WIDF (Weighted Inverse Document Frequency). Untuk pengujiansistem adalah dengan Recall & Precision. Tujuan dari penelitian ini adalah untuk implementasi sistem klasifikasidokumen teks berbahasa Indonesia dengan banyak kategori dan mengetahui tingkat akurasi hasil klasifikasi denganmetode TF-IDF dan WIDF dalam mengklasifikasikan dokumen teks berbahasa Indonesia. Penelitian ini menghasilkannilai precision dan recall rata-rata sebesar 87.50% dengan pembobotan TF-IDF dan WIDF sebesar 83.33%. Denganini diambil kesimpulan bahwa TF-IDF menghasilkan precision & recall tertinggi sebesar 87.50% dibandingkandengan WIDF yaitu 83.33% menggunakan similaritas fungsi jaccard. Hasil terbaik adalah pembobotan kata denganTF-IDF.
Copyrights © 2016