Những người tham gia được đánh giá hai lần, với 2 xếp hạng cách nhau 3 năm. Đối với hầu hết người tham gia, xếp hạng được thực hiện bởi những người đánh giá khác nhau, nhưng đối với một số (<10%), cùng một người đánh giá thực hiện cả hai xếp hạng. Có tất cả 8 người xếp loại, với 2 xếp hạng ở cả hai thời điểm.
Bây giờ, vì xếp hạng là một khía cạnh của khả năng với giá trị "chính xác" giả định, nên sự thỏa thuận tuyệt đối giữa những người xếp loại là mối quan tâm, thay vì sự nhất quán. Tuy nhiên, vì các xếp hạng được thực hiện cách nhau 3 năm, có thể đã có (và có lẽ là) một số thay đổi thực sự trong khả năng.
- Điều gì sẽ là bài kiểm tra tốt nhất về độ tin cậy trong trường hợp này?
- Tôi đang nghiêng về một mối tương quan giữa các lớp, nhưng ICC1 có phải là điều tốt nhất tôi có thể làm với những dữ liệu này không?