Liệu hồi quy tuyến tính đơn giản ngụ ý nhân quả?


17

Tôi biết mối tương quan không ngụ ý nhân quả mà thay vào đó là sức mạnh và hướng của mối quan hệ. Liệu hồi quy tuyến tính đơn giản ngụ ý nhân quả? Hoặc là một thử nghiệm thống kê suy luận (t-test, vv) cần thiết cho điều đó?


3
"Hướng" nghĩa là gì? Bạn đã đọc câu trả lời cho các câu hỏi tương tự stats.stackexchange.com/search?q=causal chưa? Câu trả lời ngắn gọn là không!
NRH

3
Không phải đề xuất của bạn ngụ ý nhân quả (hoặc hướng).
Henry

2
Tôi nghĩ rằng OP có nghĩa là "hướng" theo nghĩa tương quan tích cực và tiêu cực, không phải là hướng của bất kỳ mối quan hệ nhân quả nào giữa X và Y.
JMS

Câu trả lời:


19

Câu trả lời nhanh là, không. Bạn có thể dễ dàng đưa ra các dữ liệu không liên quan mà khi hồi quy, sẽ vượt qua tất cả các loại kiểm tra thống kê. Dưới đây là một hình ảnh cũ từ Wikipedia (mà, vì một số lý do gần đây đã bị xóa) đã được sử dụng để minh họa "quan hệ nhân quả" dựa trên dữ liệu.

Chúng ta cần nhiều hải tặc để làm mát hành tinh?

nhập mô tả hình ảnh ở đây

Đối với chuỗi thời gian, có một thuật ngữ gọi là "Nhân quả Granger" có ý nghĩa rất cụ thể.

http://en.wikipedia.org/wiki/Granger_causality

Ngoài ra, "nhân quả" là trong mắt của kẻ si tình.


Tôi có nghĩa là tương quan tích cực hoặc tiêu cực theo hướng. Cảm ơn bạn đã trả lời của bạn và liên kết đến các câu hỏi tương tự.
dùng4572

1
Đó là một trục X điên rồ trong bức tranh đó! (Nhưng ví dụ điển hình!)
Andy W

2
Một loại khác ..... Pho mát, Bơ và Cừu ở Bangladesh, so với S & P500 (R ^ 2 = 0,99) ...... nerdsonwallstreet.typepad.com/my_weblog/files/iêu ....
bill_080

5
Đồ thị đó rõ ràng là lỗi thời. Điều đó hoặc có sự thiên vị do thiếu các nhà khảo sát có sẵn để lấy mẫu ở Vịnh Aden
hồng y

2
Dữ liệu đó là trước khi Al Gore trở thành cướp biển.
bill_080

10

Trong toán học hồi quy không có gì rõ ràng về các mối quan hệ nhân quả, và do đó người ta không cần phải giải thích rõ ràng độ dốc (cường độ và hướng) cũng như các giá trị p (nghĩa là xác suất quan hệ mạnh hoặc mạnh hơn sẽ được quan sát thấy nếu mối quan hệ bằng không trong dân số) một cách nhân quả.

Điều đó đang được nói, tôi sẽ nói hồi quy có một ý nghĩa mạnh mẽ hơn nhiều rằng người ta đang ước tính một mối quan hệ định hướng rõ ràng hơn là ước tính mối tương quan giữa hai biến. Giả sử theo tương quan bạn có nghĩa là Pearson's r , nó thường không có cách hiểu nguyên nhân rõ ràng vì số liệu là đối xứng (nghĩa là bạn có thể chuyển đổi biến nào là X và Y là bạn và bạn vẫn sẽ có cùng số đo). Ngoài ra chủ nghĩa thông tục "Tương quan không bao hàm nguyên nhân" Tôi nghi ngờ là rất nổi tiếng rằng việc nêu rõ hai biến có tương quan với giả định là một không đưa ra tuyên bố nguyên nhân.

Tuy nhiên, các hiệu ứng ước tính trong phân tích hồi quy không phải là đối xứng, và do đó, bằng cách chọn biến nào ở phía bên phải so với phía bên trái, người ta sẽ đưa ra một tuyên bố ngầm không giống như tương quan. Tôi nghi ngờ người ta có ý định đưa ra một số tuyên bố nhân quả trong phần lớn các trường hợp sử dụng hồi quy (suy luận so với dự đoán sang một bên). Ngay cả trong các trường hợp chỉ nêu rõ mối tương quan, tôi nghi ngờ mọi người thường có một số mục tiêu ngụ ý về suy luận nguyên nhân trong tâm trí. Đưa ra một số hạn chế được đáp ứng tương quan có thể ngụ ý nhân quả !


6

Không tương quan hay hồi quy có thể chỉ ra quan hệ nhân quả (như được minh họa bằng câu trả lời của @ bill_080) nhưng như @Andy W chỉ ra hồi quy thường dựa trên một biến cố định (nghĩa là độc lập) rõ ràng và một biến phụ thuộc rõ ràng (nghĩa là ngẫu nhiên). Những chỉ định không phù hợp trong phân tích tương quan.

Để trích dẫn Sokal và Rohlf, 1969, tr. 496

"Trong hồi quy, chúng tôi dự định mô tả sự phụ thuộc của một biến Y vào một biến độc lập X ... để hỗ trợ cho các giả thuyết về nguyên nhân có thể của những thay đổi trong Y bởi những thay đổi trong X ..."

"Trong tương quan, ngược lại, chúng tôi quan tâm phần lớn đến việc hai biến phụ thuộc lẫn nhau hay đồng biến - nghĩa là khác nhau. Chúng tôi không biểu thị một biến như một chức năng của biến kia."

Sokal, RR và FJ Rohlf, 1969. Sinh trắc học. Freeman và Co.


4

Từ góc độ ngữ nghĩa, một mục tiêu thay thế là xây dựng bằng chứng cho một mô hình dự đoán tốt thay vì chứng minh nhân quả. Một thủ tục đơn giản để xây dựng bằng chứng cho giá trị tiên đoán của mô hình hồi quy là chia dữ liệu của bạn thành 2 phần và khớp với hồi quy của bạn với một phần dữ liệu và với phần còn lại của kiểm tra dữ liệu dự đoán nó tốt như thế nào.

Khái niệm nhân quả Granger là thú vị.


2

β^=Cov(x,y)Var(x)
α^=y¯β^x¯,

trong đó Var (.) và Cov (.) là ước tính từ mẫu (dữ liệu).

Do đó, bản thân các tham số này không có gì khác ngoài một số hàm tương quan giữa x và y. Đặc biệt, beta chỉ là một hệ số tương quan "bình thường hóa". Vì vậy, không có ngụ ý nhân quả trong hồi quy hơn là tương quan. Hồi quy nguyên nhân là một kỹ thuật đặc biệt trong kinh tế lượng, trong đó người ta sẽ phải dựa vào các biến công cụ, ví dụ như để giải quyết các hiện tượng như gây nhiễu làm che khuất sự giải thích nguyên nhân của bất kỳ mô hình hồi quy cụ thể nào.

Quan điểm của tôi là: hồi quy có thể được thực hiện theo nguyên nhân nhưng nó không phải là mặc định y.

Để biết thêm, hãy xem các video này: https://www.youtube.com/watch?v=Sqy_b5OSiXw&list=PLwJRxp3blEvaxmHgI2iOzNP6KGLSyd4dz&index=55&t=0s

"Mô hình Rubin" của chính Rubin: http://www.stat.columbia.edu/~cook/qr33.pdf

Khóa học giới thiệu tuyệt vời về quan hệ nhân quả (mặc dù, chưa có hồi quy nào): https://www.coursera.org/learn/crash-cference-in-causality


Điểm tốt. Chào mừng đến với CV.
Neil G

0

Sự hiểu biết của tôi (Tôi là người mới bắt đầu nhân quả) là như sau:

E(ϵ|X)=0


2
E(ϵ|X)=0

Xem phần này để biết số liệu thảo luận chi tiết.stackexchange.com/questions/59588/ , với một số điểm hay được thực hiện.
mlstudent

E(ε|X)= =0 có nghĩa nhân quả.
Sextus Empiricus

Tôi hơi mới đối với quan hệ nhân quả, nhưng theo tôi hiểu thì có ba mối quan tâm lớn có thể gây ra y= =α+βx+εkhông ngụ ý nhân quả. Một là nếu có một số biến bị bỏ qua khác gây ray, khác là nếu có một biến bị bỏ qua gây ra xvà cuối cùng là một phần ba y có thể gây ra x. Tất cả sẽ dẫn đến vi phạm điều kiện ngoại sinh. Tôi không có toán chính xác cho lý do tại sao nhưng thực sự sẽ tìm kiếm điều này / cố gắng rút ra nó.
mlstudent

Một ví dụ đơn giản truy cập. Khi bạn tạo dữ liệuY~N(μY,σY)X|Y~N(một+bY,σX) sau đó bạn vẫn còn E(ε|X)= =0(X và Y được phân phối bình thường chung).
Sextus Empiricus

-6

Hồi quy ĐÁNH GIÁ một mối quan hệ nhân quả .... nếu không có cơ sở cho quan hệ nhân quả là kết quả của phân tích vật lý / trí tuệ / khoa học của vấn đề, thì không có cơ sở để phân tích nguyên nhân và không có cơ sở cho hồi quy. Đây là lý do tại sao FDA và các cơ quan chính phủ tương tự luôn tuyên bố "Điều này gây ra điều đó!" chỉ để rút lại năm và thiệt hại hàng tỷ đô la, sau đó. Ví dụ như quân đoàn: cà phê, sô cô la, caffeine, thịt xông khói, trứng, v.v ....

Tệ hơn nữa là khi hai biến có vòng phản hồi. Một người có thể gây ra điểm khác tại một điểm; chỉ cho người khác gây ra một, sau này. Điều này luôn xảy ra trong lĩnh vực kinh tế của tôi: đó là lý do tại sao hầu hết các phân tích kinh tế không xứng đáng với bài báo được in.


6
Điều này là hoàn toàn sai. Hồi quy chỉ tìm thấy mối quan hệ giữa hai bộ số. Liệu mối quan hệ đó có tồn tại vì có mối liên hệ nhân quả trực tiếp hay không là một vấn đề hoàn toàn khác.
gung - Phục hồi Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.