Hồi quy về giá trị trung bình trong Tư duy, nhanh và chậm


14

Trong suy nghĩ, nhanh và chậm , Daniel Kahneman đặt ra câu hỏi giả thuyết sau:

(P. 186) Julie hiện đang là sinh viên năm cuối của một trường đại học công lập. Cô đọc trôi chảy khi cô bốn tuổi. Điểm trung bình của cô ấy (GPA) là bao nhiêu?

Ý định của ông là minh họa cách chúng ta thường không tính đến hồi quy trung bình khi đưa ra dự đoán về một số thống kê nhất định. Trong các cuộc thảo luận sau đó, ông khuyên:

(P. 190) Hãy nhớ lại rằng mối tương quan giữa hai biện pháp trong trường hợp đọc tuổi hiện tại và GPA Tiết kiệm bằng với tỷ lệ các yếu tố được chia sẻ giữa các yếu tố quyết định. Dự đoán tốt nhất của bạn về tỷ lệ đó là gì? Dự đoán lạc quan nhất của tôi là khoảng 30%. Giả sử ước tính này, chúng ta có tất cả những gì chúng ta cần để đưa ra một dự đoán không thiên vị. Dưới đây là hướng dẫn cách đi đến đó trong bốn bước đơn giản:

  1. Bắt đầu với ước tính điểm trung bình GPA.
  2. Xác định GPA phù hợp với ấn tượng của bạn về bằng chứng.
  3. Ước tính mối tương quan giữa đọc trước và GPA.
  4. Nếu tương quan là 0,30, hãy di chuyển 30% khoảng cách từ trung bình đến GPA phù hợp.

Giải thích của tôi về lời khuyên của anh ấy như sau:

  1. Sử dụng "Cô ấy đọc trôi chảy khi cô ấy bốn tuổi" để thiết lập một số điểm chuẩn cho khả năng đọc của Julie.
  2. Xác định điểm trung bình có điểm chuẩn tương ứng. (Điểm trung bình hợp lý để dự đoán sẽ tương ứng với điểm chuẩn này nếu mối tương quan giữa điểm trung bình và tốc độ đọc là hoàn hảo.)
  3. Ước tính bao nhiêu phần trăm của các biến thể trong GPA có thể được giải thích bằng các biến thể về tốc độ đọc. (Tôi cho rằng anh ta đang đề cập đến hệ số xác định với "tương quan" trong bối cảnh này?)
  4. Bởi vì chỉ có 30% số điểm chuẩn của tỷ lệ đọc của Julie có thể được giải thích bằng các yếu tố cũng có thể giải thích điểm chuẩn của điểm trung bình của cô ấy, nên chúng tôi chỉ có lý khi dự đoán rằng điểm chuẩn của GPA của Julie sẽ là 30% so với điểm số của nó trong trường hợp tương quan hoàn hảo.

Giải thích của tôi về thủ tục của Kahneman có đúng không? Nếu vậy, có một biện minh toán học chính thức hơn về thủ tục của mình, đặc biệt là bước 4? Nói chung, mối quan hệ giữa mối tương quan giữa hai biến và thay đổi / khác biệt trong điểm số tiêu chuẩn của họ là gì?

Câu trả lời:


2

Giải thích của tôi về thủ tục của Kahneman có đúng không?

Điều này hơi khó nói, bởi vì bước 2 của Kahneman không được xây dựng chính xác: "Xác định GPA phù hợp với ấn tượng của bạn về bằng chứng" - chính xác điều đó có nghĩa là gì? Nếu ấn tượng của ai đó được hiệu chỉnh tốt, thì sẽ không cần phải sửa theo giá trị trung bình. Nếu ấn tượng của ai đó bị giảm đi, thì họ nên sửa thậm chí còn mạnh hơn.

Vì vậy, tôi đồng ý với @AndyW rằng lời khuyên của Kahneman chỉ là một quy tắc.

zz

[...] Có một biện minh toán học chính thức hơn về thủ tục của anh ta, đặc biệt là bước 4? Nói chung, mối quan hệ giữa mối tương quan giữa hai biến và thay đổi / khác biệt trong điểm số tiêu chuẩn của họ là gì?

yxzρ

y= =ρx,

xyρ

Đây chính xác là cái được gọi là "hồi quy trung bình". Bạn có thể thấy một số công thức và dẫn xuất trong cuộc thảo luận trên Wikipedia .


8

Thứ tự các số của bạn không khớp với trích dẫn của Kahneman. Bởi vì điều này có vẻ như bạn có thể đang thiếu điểm tổng thể.

Quan điểm của Kahneman là quan trọng nhất. Nó có nghĩa là ước tính GPA trung bình - cho tất cả mọi người. Điểm đằng sau lời khuyên này là nó là mỏ neo của bạn. Bất kỳ dự đoán nào bạn đưa ra nên được tham khảo các thay đổi xung quanh điểm neo này. Tôi không chắc chắn tôi thấy bước này trong bất kỳ điểm nào của bạn!

Kahneman sử dụng từ viết tắt, WYSIATI, những gì bạn thấy là tất cả có. Đây là xu hướng của con người để đánh giá quá cao tầm quan trọng của thông tin hiện có. Đối với nhiều người, thông tin về khả năng đọc sẽ khiến mọi người nghĩ rằng Julie thông minh, và vì vậy mọi người sẽ đoán được điểm trung bình của một người thông minh.

Nhưng, hành vi của một đứa trẻ ở bốn tuổi chứa rất ít thông tin liên quan đến hành vi của người lớn. Bạn có lẽ tốt hơn là bỏ qua nó trong việc đưa ra dự đoán. Nó chỉ nên lắc lư bạn khỏi mỏ neo của bạn một lượng nhỏ. Ngoài ra, người đầu tiên đoán GPA của người thông minh có thể rất không chính xác. Do lựa chọn, phần lớn người cao niên trong trường đại học có trí thông minh trên trung bình.

Thực tế, có một số thông tin ẩn khác trong câu hỏi ngoài khả năng đọc của Julie lúc bốn tuổi.

  • Julie có khả năng là một tên nữ
  • Cô đang theo học một trường đại học nhà nước
  • Cô ấy là sinh viên năm cuối

Tôi nghi ngờ cả ba đặc điểm này đều tăng GPA trung bình một chút so với tổng số học sinh. Ví dụ: tôi cá là Người cao niên 'có khả năng có GPA cao hơn Sophmores' bởi vì những sinh viên có điểm trung bình rất tệ bị bỏ học.

Vì vậy, thủ tục của Kahneman (như một giả thuyết) sẽ diễn ra như thế này.

  1. Điểm trung bình chung cho một nữ cao cấp trong một trường đại học công lập là 3,1.
  2. Tôi đoán rằng dựa trên khả năng đọc nâng cao của Julie ở mức 4 mà điểm trung bình của cô ấy là 3,8
  3. Tôi đoán khả năng đọc ở 4 tuổi có tương quan 0,3 với GPA
  4. 30% của khoảng cách giữa 3,1 và 3,8 là 3,3 (nghĩa là 3.1 + (3.8-3.1)*0.3)

Vì vậy, trong giả thuyết này, dự đoán cuối cùng cho GPA của Julie là 3,3.

Hồi quy trung bình theo cách tiếp cận của Kahneman là bước 2 có thể là một ước tính quá mức về tầm quan trọng của thông tin có sẵn. Vì vậy, một chiến lược tốt hơn là hồi quy dự đoán của chúng tôi trở lại ý nghĩa tổng thể. Bước 3 và 4 là các cách (đặc biệt) để ước tính mức độ hồi quy.


Tôi hiểu trực giác đằng sau thủ tục, nhưng không phải là biện minh toán học. Giải thích của tôi là điểm ước tính điểm trung bình GPA là cho phép người ta ước tính điểm trung bình cụ thể về điểm số tiêu chuẩn; mặt khác, chúng không thể có ý nghĩa so với việc đọc trước. (Tiếp)
Khẩu phần

1
Kahneman đề cập rằng hầu hết mọi người đoán GPA = 3.7 hoặc 3.8, có thể tương ứng với điểm số tiêu chuẩn mà họ liên kết với tốc độ đọc của Julie, nhưng cũng mặc nhiên cho rằng mối tương quan giữa hai biến là hoàn hảo. Tôi chủ yếu bối rối về việc liệu bước 4 là quy tắc dựa trên trực giác hay quy trình thực tế, có giá trị thống kê (nghĩa là người ta có thể điều trị điểm chuẩn một cách phụ thuộc và lấy tỷ lệ của chúng dựa trên mối tương quan?). Nếu nó chỉ là quy tắc ngón tay cái của giáo dân, liệu có tồn tại một phương pháp gần đúng nghiêm ngặt hơn về mặt thống kê?
Khẩu phần

Bằng cách "bổ sung", tôi đề cập đến giả định của chúng tôi rằng (1) một số tỷ lệ GPA điểm chuẩn của Julie được giải thích bởi các yếu tố cũng có thể giải thích cho việc đọc trước của cô ấy, rằng (2) tỷ lệ GPA điểm chuẩn còn lại của cô ấy được giải thích bởi các yếu tố duy nhất để giải thích GPA, rằng (3) những đóng góp này được tính bằng với điểm GPA tiêu chuẩn cuối cùng mà chúng tôi dự đoán cho Julie và (4) chúng tôi có thể điều chỉnh dự đoán của mình bằng cách chỉ cần lấy một tỷ lệ dự đoán sai lệch của chúng tôi. Là làm việc với tỷ lệ độ lệch chuẩn như điều này trái ngược với, nói, làm việc với căn bậc hai của họ có hợp lệ không?
Khẩu phần

Đó là một quy tắc đặc biệt. Bước hai và ba không nhất thiết phải phù hợp về mặt logic với nhau. (Chúng là hai cách khác nhau để nói cùng một thông tin, một là kích thước hiệu ứng và hai là kích thước hiệu ứng được tiêu chuẩn hóa.)
Andy W
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.