Bahasa Kerinci merupakan salah satu bahasa daerah di Indonesia yang tergolong low-resource language, sehingga ketersediaan sumber daya linguistik digital sangat terbatas. Penelitian ini bertujuan untuk mengekstraksi informasi leksikal dari kamus dwibahasa Indonesia–Kerinci dan melakukan klasifikasi kelas kata (Part-of-Speech/POS) secara otomatis menggunakan pendekatan berbasis aturan (rule-based). Proses penelitian dimulai dengan mengonversi kamus dwibahasa Indonesia–Kerinci ke dalam format dataset terstruktur yang memuat lema, padanan kata, serta informasi linguistik terkait. Selanjutnya, dilakukan klasifikasi kelas kata secara otomatis menggunakan pendekatan rule-based dengan memanfaatkan padanan bahasa Indonesia sebagai acuan untuk menentukan POS pada lema bahasa Kerinci. Hasil penelitian menghasilkan dataset digital terstruktur beserta label POS otomatis yang dapat dijadikan sumber daya awal untuk pemrosesan bahasa alami (Natural Language Processing/NLP) dalam bahasa Kerinci. Kontribusi utama penelitian ini adalah menyediakan sumber daya linguistik digital awal untuk bahasa daerah yang masih minim data, serta menawarkan strategi klasifikasi POS berbasis leksikal yang sederhana dan dapat direplikasi pada bahasa daerah lain.
Copyrights © 2026