Tại sao chúng ta lại nói biến kết quả là hồi quy trên người dự đoán (s)?


16

Có một số giải thích trực quan cho thuật ngữ này? Tại sao nó lại theo cách này mà không phải (các) người dự đoán bị thụt lùi về kết quả?

Lý tưởng nhất là tôi hy vọng rằng một lời giải thích phù hợp về lý do tại sao thuật ngữ này tồn tại sẽ giúp học sinh nhớ nó và ngăn họ nói sai theo cách khác.


1
Chúng ta làm gì Tôi không chắc chắn tôi đã từng nói điều đó - và tôi đã thảo luận về hồi quy rất nhiều. Nếu bạn biết ai đó nói điều đó, có lẽ bạn có thể hỏi họ. (Tôi có dịp nói " thụt lùi trên " - nhưng vào sẽ nghe hơi lạ với tôi)
Glen_b -Reinstate Monica

Cảm ơn - Tôi đã có nghĩa là "bật" chứ không phải "lên". Tôi đã sửa nó rồi.
user1205901 - Tái lập lại

Câu trả lời:


19

Tôi không biết từ nguyên của "bị thoái bộ" là gì nhưng đây là cách giải thích mà tôi có trong đầu khi tôi nói hoặc nghe biểu hiện này. Hãy xem xét con số sau đây từ Các yếu tố của học thống kê của Hastie et al.:

hồi quy là phép chiếu

Trong cốt lõi của nó, hồi quy tuyến tính số tiền để chiếu trực giao của vào (lên) X , nơi yn vector chiều quan sát của biến phụ thuộc và X là không gian con kéo dài bởi các vectơ dự đoán.yXynX

Đây là một giải thích rất hữu ích của hồi quy tuyến tính.

Kể từ khi đang được chiếu lên X , đó là những gì tôi nghĩ khi tôi nghe rằng y là "thụt lùi vào" X . Từ quan điểm này, nó sẽ làm cho ít tinh thần để nói rằng X là thụt lùi về y hay rằng y đang thụt lùi "chống lại" hoặc "với" X .yXyXXyyX

Lý tưởng nhất là tôi hy vọng rằng một lời giải thích phù hợp về lý do tại sao thuật ngữ này tồn tại sẽ giúp học sinh nhớ nó và ngăn họ nói sai theo cách khác.

Như tôi đã nói, tôi nghi ngờ rằng đây là một lời giải thích tại sao thuật ngữ này tồn tại (có lẽ chỉ có lý do tại sao nó tồn tại?), Nhưng tôi chắc chắn rằng nó có thể giúp sinh viên nhớ nó.


2
+1. Phụ thuộc vào các sinh viên! Đây rõ ràng là một cách hợp lệ và hiệu quả để nói chuyện và suy nghĩ ở cấp độ trung cấp hoặc cao cấp. Cho dù nó chịu trách nhiệm cho thuật ngữ "trên" tôi tự hỏi. Cách đây không lâu, bạn có thể tìm thấy các văn bản hồi quy gần như không có sơ đồ, chứ chưa nói đến một cách tiếp cận hình học hoặc hình học mạnh mẽ, mặc dù điều đó bây giờ hoàn toàn là tiêu chuẩn, trong khi tôi nghĩ thuật ngữ này đã lùi xa hàng thập kỷ.
Nick Cox

(+1) Cách duy nhất mà tôi có khái niệm hồi quy qua hộp sọ là nghĩ về nó như hình chiếu của lên không gian cột C ( A ) của ma trận mô hình, mà tôi nghĩ đó là cách hiểu hình học mà bạn đang thể hiện . yC(A)
Antoni Parellada

1
Đây là một lý do thống kê rất tốt cho việc sử dụng thuật ngữ. Các lý do xã hội hoặc ngôn ngữ tại sao nó phổ biến có thể khác nhau!
Nick Cox

Chỉ cần rõ ràng: Tôi hoàn toàn đồng ý với những gì @NickCox đã nói trong các bình luận ở đây.
amip nói rằng Phục hồi lại

6

Tôi thường sử dụng và nghe cách nói này. Tôi đoán rằng trình tự đề cập đến kết quả hoặc phản hồi trước các yếu tố dự đoán xuất phát từ các quy ước bằng văn bản, sử dụng các từ hoặc sử dụng ký hiệu hoặc trộn lẫn cả hai, cho đến khi

Y=Xβ

đặt sang một bên câu hỏi không kém phần thú vị (hoặc không thú vị!) về cái mà chúng ta gọi là các loại biến khác nhau.

Nhưng dường như có giá trị như nhau về mặt toán học và thống kê để đề cập đến các yếu tố dự đoán trước tiên, giống như nhiều nhà toán học viết ánh xạ hoặc các hàm với các đối số trước tiên.

Điều thường có thể thúc đẩy trình tự chúng ta sử dụng trong các cuộc thảo luận thống kê là về mặt khoa học hoặc thực tế, chúng ta thường có một ý tưởng rõ ràng về những gì chúng ta đang cố gắng dự đoán - đó là tỷ lệ tử vong, hoặc thu nhập, hoặc sản lượng lúa mì, hoặc bỏ phiếu trong một cuộc bầu cử, hoặc bất cứ điều gì - trong khi nhóm các dự đoán tiềm năng hoặc thực tế có thể không quá rõ ràng. Ngay cả khi nó rõ ràng, nó có ý nghĩa để đề cập đến những điều quan trọng đầu tiên. Bạn đang cố làm gì vậy? Dự đoán bất cứ điều gì . Bạn định thực hiện nó như thế nào? Sử dụng một số hoặc tất cả các biến này .

Tôi không có câu chuyện cho "bật" hơn là bất kỳ từ nào phù hợp. Tôi không nghe thấy "hồi quy chống lại" hoặc "thoái lui với". Có thể không có logic ở đây, chỉ là các memes được truyền lại trong sách giáo khoa, giảng dạy và thảo luận.

yx


+1. Nhưng cách giải thích cá nhân của tôi về "hồi quy trên" là thông qua "dự kiến", xem câu trả lời của tôi. Tôi tự hỏi nếu nhiều người nghĩ về biểu hiện này theo cách này, hoặc chỉ có tôi.
amip nói rằng Phục hồi lại

3

1) Thuật ngữ hồi quy xuất phát từ thực tế là trong mô hình hồi quy tuyến tính đơn giản thông thường:

y=α+βx+ϵ

yxy^y¯xx¯

|y^y¯|/sy<|x-x¯|/Sx

Ví dụ: nếu chúng ta sử dụng khung dữ liệu BOD được tích hợp trong R thì:

fm <- lm(demand ~ Time, BOD)
with(BOD, all( abs(fitted(fm) - mean(demand)) / sd(demand) < abs(scale(Time))))
## [1] TRUE

Để biết bằng chứng, hãy xem: https://en.wikipedia.org/wiki/Regression_toward_the_mean

2) Thuật ngữ trên xuất phát từ thực tế là các giá trị được trang bị là hình chiếu của biến kết quả lên không gian con được kéo dài bởi các biến dự đoán (bao gồm cả phần chặn) như được giải thích thêm trong nhiều nguồn như http: //people.eecs.ku .edu / ~ jhuan / EECS940_S12 / slide / linearRegression.pdf .


1
Tôi khá chắc chắn rằng đó không phải là nơi hồi quy thuật ngữ đến từ. Trong một thời gian đầu sử dụng chiều cao của con trai đã bị thoái lui về chiều cao của cha; do kết quả đảo ngược trung bình cho thấy con trai của những người cha cao có xu hướng thoái lui về trung bình.
PaulB

0

Cá nhân, khi giải thích thuật ngữ, tôi thấy định nghĩa của thuật ngữ này luôn luôn có ích, đặc biệt là khi giải thích cho sinh viên. Định nghĩa thực tế của hồi quy từ là:

"trở về trạng thái cũ hoặc kém phát triển".

Vì vậy, một cách để giải thích tôi đoán sẽ là như sau:

"Nghĩ về kết quả là trạng thái phát triển đầy đủ, chúng tôi cố gắng giải thích kết quả bằng cách sử dụng các trạng thái kém phát triển hơn, tức là các biến độc lập. Do đó, kết quả được hồi quy trên các yếu tố dự đoán."

Mong rằng sẽ giúp.


1
Có nhiều hơn một "định nghĩa thực tế". Tôi muốn đề xuất rằng trong khoa học thống kê, định nghĩa kỹ thuật của hồi quy là phù hợp với một mô hình (theo mặc định là mô hình tuyến tính) hiện là chính và ý nghĩa lịch sử được ghi nhận bởi "hồi quy trung bình", vẫn còn thú vị và đôi khi hữu ích, là thứ hai. Tôi không thấy hữu ích khi nghĩ rằng các yếu tố dự đoán nói chung là "các quốc gia kém phát triển", ví dụ như không có ý nghĩa trong đó lượng mưa dự báo là trạng thái kém phát triển của năng suất lúa mì. Dù bằng cách nào, tôi không thấy cách này giải thích biểu thức.
Nick Cox

Tôi thấy quan điểm của bạn hoàn toàn. Có cách nào bạn có thể giải thích hồi quy thông qua định nghĩa tôi đã đăng không? Bởi vì cách tôi nghĩ về "kém phát triển" không phải ở ý nghĩa lượng mưa kém phát triển hơn năng suất lúa mì, mà giống như một thứ có thể giải thích một phần năng suất lúa mì.
EhsanF

1
Nếu "kém phát triển" không có nghĩa là kém phát triển, tôi không thể thấy rằng từ ngữ giúp ích gì cả.
Nick Cox
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.