Penelitian ini dilatarbelakangi oleh peneliti yang tertarik dengan evaluasi hasil belajar siswa di dunia Pendidikan dan menyadari bahwa sebagian guru belum mampu menganalisis pembelajaran secara optimal. Tujuan dilakukannya penelitian ini untuk menganalisis butir soal PAS mata pelajaran PPKn di MAN 2 Sleman menggunakan program Iteman 3.0. Metode yang diakukan berbentuk kuantitatif dengan populasi 191 siswa kelas XI dari 6 kelas. Analisis data mencakup tingkat kesukaran soal, daya pembeda, dan efektivitas pengecoh. Hasil penelitian menunjukkan tingkat kesukaran soal: mudah sebanyak 10 dari 40 soal (25%), sedang sebanyak 21 soal (52,5%), dan sukar sebanyak 9 soal (22,5%). Daya pembeda: tinggi sebanyak 14 soal (35%), sedang sebanyak 19 soal (47,5%), rendah sebanyak 6 soal (15%), dan sangat rendah sebanyak 1 soal (2,5%). Efektivitas pengecoh yang berfungsi adalah 115 dari 160 opsi (71,9%), sementara yang tidak berfungsi sebanyak 45 opsi (28,1%). Secara keseluruhan, soal memiliki kualitas baik dengan tingkat kesulitan sedang, daya pembeda baik, dan efektivitas pengecoh yang berfungsi. Hasil ini menunjukkan bahwa hipotesis peneliti yang menyatakan bahwa soal memiliki karakteristik tidak baik harus ditolak, karena soal ternyata berkualitas baik.This research was motivated by the researcher's interest in evaluating students' learning outcomes in the education sector and the realization that some teachers have not been able to analyze learning optimally. The purpose of this study is to analyze the items of the End of Semester Assessment for the subject of Pancasila and Citizenship Education at Madrasah Aliyah Negeri 2 Sleman using the Iteman 3.0 program. The research method is quantitative, with a population of 191 eleventh-grade students from 6 classes. Data analysis includes item difficulty level, discriminating power, and the effectiveness of distractors. The research results show the difficulty level of the questions: easy (10 out of 40 questions or 25%), moderate (21 out of 40 questions or 52.5%), and difficult (9 out of 40 questions or 22.5%). Discriminating power: high (14 questions or 35%), moderate (19 questions or 47.5%), low (6 questions or 15%), and very low (1 question or 2.5%). The effectiveness of functioning distractors is 115 out of 160 options (71.9%), while non-functioning distractors amount to 45 options (28.1%). Overall, the questions are of good quality, with a moderate difficulty level, good discriminating power, and effective distractors. These results indicate that the researcher's hypothesis, which stated that the questions have poor characteristics, must be rejected because the questions are of good quality.