Trong suy nghĩ, nhanh và chậm , Daniel Kahneman đặt ra câu hỏi giả thuyết sau:
(P. 186) Julie hiện đang là sinh viên năm cuối của một trường đại học công lập. Cô đọc trôi chảy khi cô bốn tuổi. Điểm trung bình của cô ấy (GPA) là bao nhiêu?
Ý định của ông là minh họa cách chúng ta thường không tính đến hồi quy trung bình khi đưa ra dự đoán về một số thống kê nhất định. Trong các cuộc thảo luận sau đó, ông khuyên:
(P. 190) Hãy nhớ lại rằng mối tương quan giữa hai biện pháp trong trường hợp đọc tuổi hiện tại và GPA Tiết kiệm bằng với tỷ lệ các yếu tố được chia sẻ giữa các yếu tố quyết định. Dự đoán tốt nhất của bạn về tỷ lệ đó là gì? Dự đoán lạc quan nhất của tôi là khoảng 30%. Giả sử ước tính này, chúng ta có tất cả những gì chúng ta cần để đưa ra một dự đoán không thiên vị. Dưới đây là hướng dẫn cách đi đến đó trong bốn bước đơn giản:
- Bắt đầu với ước tính điểm trung bình GPA.
- Xác định GPA phù hợp với ấn tượng của bạn về bằng chứng.
- Ước tính mối tương quan giữa đọc trước và GPA.
- Nếu tương quan là 0,30, hãy di chuyển 30% khoảng cách từ trung bình đến GPA phù hợp.
Giải thích của tôi về lời khuyên của anh ấy như sau:
- Sử dụng "Cô ấy đọc trôi chảy khi cô ấy bốn tuổi" để thiết lập một số điểm chuẩn cho khả năng đọc của Julie.
- Xác định điểm trung bình có điểm chuẩn tương ứng. (Điểm trung bình hợp lý để dự đoán sẽ tương ứng với điểm chuẩn này nếu mối tương quan giữa điểm trung bình và tốc độ đọc là hoàn hảo.)
- Ước tính bao nhiêu phần trăm của các biến thể trong GPA có thể được giải thích bằng các biến thể về tốc độ đọc. (Tôi cho rằng anh ta đang đề cập đến hệ số xác định với "tương quan" trong bối cảnh này?)
- Bởi vì chỉ có 30% số điểm chuẩn của tỷ lệ đọc của Julie có thể được giải thích bằng các yếu tố cũng có thể giải thích điểm chuẩn của điểm trung bình của cô ấy, nên chúng tôi chỉ có lý khi dự đoán rằng điểm chuẩn của GPA của Julie sẽ là 30% so với điểm số của nó trong trường hợp tương quan hoàn hảo.
Giải thích của tôi về thủ tục của Kahneman có đúng không? Nếu vậy, có một biện minh toán học chính thức hơn về thủ tục của mình, đặc biệt là bước 4? Nói chung, mối quan hệ giữa mối tương quan giữa hai biến và thay đổi / khác biệt trong điểm số tiêu chuẩn của họ là gì?