Các kết quả của công thức tiên tri Spearman-Brown bị ảnh hưởng như thế nào khi có các câu hỏi kiểm tra về những khó khăn khác nhau hoặc những người đánh giá là những học sinh dễ hoặc khó. Một văn bản tôn trọng nói rằng SB bị ảnh hưởng, nhưng không cung cấp chi tiết. (Xem trích dẫn dưới đây.)
Guion, R. M (2011). Đánh giá, Đo lường và Dự đoán cho các Quyết định Nhân sự, tái bản lần thứ 2. PGS 477
"Độ tin cậy có thể tăng lên bằng cách gộp nhóm, sử dụng phương trình Spearman-Brown. ... Nếu độ tin cậy của một xếp hạng là 0,5, thì độ tin cậy của hai, bốn hoặc sáu xếp hạng song song sẽ xấp xỉ 0,67, 0,80 và .86, tương ứng "(Houston, Raymond, & Svec, 1991, trang 409). Tôi thích trích dẫn này vì từ này nhận ra rằng các ước tính thống kê là các tuyên bố "trên trung bình" về những gì có thể được mong đợi nếu tất cả diễn ra như giả định. Ngoài ra, từ hoạt động là song song. Xếp hạng trung bình (hoặc sử dụng Spearman-Brown) nếu một người đánh giá, chẳng hạn, khoan dung một cách có hệ thống, đơn giản là không phù hợp với giả định. Nếu các bài tiểu luận được đánh giá bởi hai người xếp loại, một người khoan dung hơn người khác, thì vấn đề giống như việc sử dụng hai bài kiểm tra trắc nghiệm có độ khó không bằng nhau (dạng không đối xứng). Điểm số dựa trên các hình thức kiểm tra khác nhau (không tương đương) không thể so sánh được. Vì vậy, đó là với việc trộn các con chuột khoan hồng và khó khăn; độ tin cậy của các xếp hạng gộp được ước tính không chính xác bởi phương trình Spearman-Brown của lý thuyết kiểm tra cổ điển. Vấn đề sẽ tồi tệ hơn nếu mỗi thẩm phán định nghĩa một cấu trúc khác nhau một chút. "