Penelitian ini bertujuan untuk mengevaluasi presisi pengukuran instrumen hasil belajar dengan memanfaatkan keunggulan metrik Item Response Theory (IRT). Berbeda dengan Classical Test Theory (CTT) yang mengasumsikan kesalahan pengukuran konstan, penelitian ini menganalisis variabilitas Fungsi Informasi Tes (TIF) dan Standard Error of Measurement (SE(θ)) di sepanjang kontinum kemampuan. Metode penelitian yang digunakan adalah kuantitatif deskriptif-evaluatif dengan melibatkan 620 responden yang mengerjakan 45 butir soal pilihan ganda dikotomus. Kalibrasi dilakukan menggunakan Model 3-Parameter Logistik (3PL) melalui Software Xcalibre pada lingkungan R untuk mengestimasi parameter daya beda (a), tingkat kesulitan (b), dan tebakan semu (c). Hasil analisis menunjukkan bahwa model 3PL memiliki kesesuaian yang sangat baik dengan data (RMSEA = 0,051; SRMR = 0,042). Temuan utama mengindikasikan bahwa TIF mencapai nilai maksimum sebesar 25,80 pada tingkat kemampuan = +0,25, yang berkorespondensi dengan nilai SE(θ) minimum sebesar 0,197. Sebaliknya, pada rentang kemampuan ekstrem (θ < -2.0 and θ > +2.5), nilai SE(θ) meningkat tajam hingga mencapai 0,392, yang menunjukkan penurunan presisi pengukuran secara signifikan. Simpulan dari penelitian ini menegaskan bahwa presisi penskoran bersifat heteroskedastik atau bergantung pada tingkat kemampuan individu. Oleh karena itu, institusi pendidikan direkomendasikan untuk beralih dari pelaporan skor tunggal ke pelaporan skor yang disertai dengan Interval Kepercayaan 95% guna meminimalisir bias interpretasi. Selain itu, pengembangan tes di masa depan perlu menambah butir soal dengan tingkat kesulitan ekstrem untuk meratakan distribusi informasi tes.
Copyrights © 2025