Giả sử một người giám thị nghi ngờ một sinh viên sao chép câu trả lời ra khỏi bài viết của một sinh viên khác trong kỳ thi trắc nghiệm. Sau đó, cô kiểm tra câu trả lời của họ và tìm thấy một số điểm tương đồng, nhưng mặt khác, chắc chắn có những điểm tương đồng với bản chất của kỳ thi. Làm thế nào cô ấy nên đi về việc xác định liệu những nghi ngờ của cô đã được thành lập?
Nói cách khác, cô ấy chắc chắn sẽ phải so sánh các kỳ thi với những học sinh khác (những người, chúng ta giả sử, không gian lận). Nhưng nếu quy mô lớp học rất lớn, có hợp lý để lấy mẫu ngẫu nhiên để so sánh không? Cô ấy sẽ lấy bao nhiêu? Nếu có nhiều câu hỏi trong bài kiểm tra, việc lấy mẫu các câu hỏi để so sánh có hợp lý không? Liệu nó có tạo ra sự khác biệt đáng kể cho dù mỗi câu hỏi có 2 câu trả lời có thể (đúng / sai) hoặc, nói, 4?
Tôi không có bất kỳ con số cụ thể nào vì tôi đang tự hỏi về cách thức hoạt động của nó nói chung. Tôi có một nền tảng về toán học nhưng ít được đào tạo về thống kê. Làm thế nào bạn sẽ mô tả phân tích này trong thuật ngữ thống kê?
Cảm ơn bạn.