Có một lý do thống kê tại sao lý thuyết phân tích / phản ứng mục không được áp dụng rộng rãi hơn? Chẳng hạn, nếu một giáo viên làm bài kiểm tra trắc nghiệm 25 câu hỏi và thấy rằng 10 câu hỏi đã được trả lời đúng bởi mọi người, thì 10 câu hỏi đã được trả lời với tỷ lệ rất thấp (10%) và 5 câu hỏi còn lại được trả lời bởi khoảng 50% số người . Không có ý nghĩa gì khi đánh giá lại điểm số để những câu hỏi khó được cân nhắc nhiều hơn?
Tuy nhiên, trong các bài kiểm tra trong thế giới thực hầu như luôn có tất cả các câu hỏi có trọng số như nhau. Tại sao?
Liên kết dưới đây thảo luận về các chỉ số phân biệt đối xử và các biện pháp khó khăn khác để chọn câu hỏi nào là tốt nhất: http://fcit.usf.edu/assessment/selected/responsec.html
Dường như phương pháp tìm ra chỉ số phân biệt đối xử của các câu hỏi chỉ được sử dụng theo cách nhìn về phía trước (ví dụ: nếu một câu hỏi không phân biệt tốt, hãy ném nó). Tại sao các bài kiểm tra không có trọng số lại cho dân số hiện tại?