Akronim didefinisikan sebagai singkatan yang dibentuk oleh huruf awal atau gabungan beberapa huruf dari istilah penting dalam sebuah frase. Menemukan akronim dan kepanjangannya secara otomatis dalam suatu dokumen teks adalah masalah yang menantang dalam teks mining. Artikel ini membahas tentang penentuan kepanjangan dari akronim berbahasa Indonesia secara otomatis. Ada tiga tahap yang dilakukan. Pertama, kandidat akronim diidentifikasi dalam dokumen teks. Kemudian, kandidat ekspansi dibangun berdasarkan teks yang mengelilingi akronim, dan ketiga, klasifikasi k-NN digunakan untuk memilih ekspansi yang benar dari sebuah akronim. Percobaan dilakukan menggunakan teks yang diperoleh dari empat web berbahasa Indonesia yang berbeda. Hasil menunjukkan bahwa algoritma yang dikembangkan dapat beradaptasi dengan baik pada setiap domain dan memiliki rata-rata akurasi sebesar 89,75%. Â Kata Kunci: Penentuan akronim dan ekspansinya, klasifikasi kNN Â
Copyrights © 2011