Tôi biết mối tương quan không ngụ ý nhân quả mà thay vào đó là sức mạnh và hướng của mối quan hệ. Liệu hồi quy tuyến tính đơn giản ngụ ý nhân quả? Hoặc là một thử nghiệm thống kê suy luận (t-test, vv) cần thiết cho điều đó?
Tôi biết mối tương quan không ngụ ý nhân quả mà thay vào đó là sức mạnh và hướng của mối quan hệ. Liệu hồi quy tuyến tính đơn giản ngụ ý nhân quả? Hoặc là một thử nghiệm thống kê suy luận (t-test, vv) cần thiết cho điều đó?
Câu trả lời:
Câu trả lời nhanh là, không. Bạn có thể dễ dàng đưa ra các dữ liệu không liên quan mà khi hồi quy, sẽ vượt qua tất cả các loại kiểm tra thống kê. Dưới đây là một hình ảnh cũ từ Wikipedia (mà, vì một số lý do gần đây đã bị xóa) đã được sử dụng để minh họa "quan hệ nhân quả" dựa trên dữ liệu.
Chúng ta cần nhiều hải tặc để làm mát hành tinh?
Đối với chuỗi thời gian, có một thuật ngữ gọi là "Nhân quả Granger" có ý nghĩa rất cụ thể.
http://en.wikipedia.org/wiki/Granger_causality
Ngoài ra, "nhân quả" là trong mắt của kẻ si tình.
Trong toán học hồi quy không có gì rõ ràng về các mối quan hệ nhân quả, và do đó người ta không cần phải giải thích rõ ràng độ dốc (cường độ và hướng) cũng như các giá trị p (nghĩa là xác suất quan hệ mạnh hoặc mạnh hơn sẽ được quan sát thấy nếu mối quan hệ bằng không trong dân số) một cách nhân quả.
Điều đó đang được nói, tôi sẽ nói hồi quy có một ý nghĩa mạnh mẽ hơn nhiều rằng người ta đang ước tính một mối quan hệ định hướng rõ ràng hơn là ước tính mối tương quan giữa hai biến. Giả sử theo tương quan bạn có nghĩa là Pearson's r , nó thường không có cách hiểu nguyên nhân rõ ràng vì số liệu là đối xứng (nghĩa là bạn có thể chuyển đổi biến nào là X và Y là bạn và bạn vẫn sẽ có cùng số đo). Ngoài ra chủ nghĩa thông tục "Tương quan không bao hàm nguyên nhân" Tôi nghi ngờ là rất nổi tiếng rằng việc nêu rõ hai biến có tương quan với giả định là một không đưa ra tuyên bố nguyên nhân.
Tuy nhiên, các hiệu ứng ước tính trong phân tích hồi quy không phải là đối xứng, và do đó, bằng cách chọn biến nào ở phía bên phải so với phía bên trái, người ta sẽ đưa ra một tuyên bố ngầm không giống như tương quan. Tôi nghi ngờ người ta có ý định đưa ra một số tuyên bố nhân quả trong phần lớn các trường hợp sử dụng hồi quy (suy luận so với dự đoán sang một bên). Ngay cả trong các trường hợp chỉ nêu rõ mối tương quan, tôi nghi ngờ mọi người thường có một số mục tiêu ngụ ý về suy luận nguyên nhân trong tâm trí. Đưa ra một số hạn chế được đáp ứng tương quan có thể ngụ ý nhân quả !
Không tương quan hay hồi quy có thể chỉ ra quan hệ nhân quả (như được minh họa bằng câu trả lời của @ bill_080) nhưng như @Andy W chỉ ra hồi quy thường dựa trên một biến cố định (nghĩa là độc lập) rõ ràng và một biến phụ thuộc rõ ràng (nghĩa là ngẫu nhiên). Những chỉ định không phù hợp trong phân tích tương quan.
Để trích dẫn Sokal và Rohlf, 1969, tr. 496
"Trong hồi quy, chúng tôi dự định mô tả sự phụ thuộc của một biến Y vào một biến độc lập X ... để hỗ trợ cho các giả thuyết về nguyên nhân có thể của những thay đổi trong Y bởi những thay đổi trong X ..."
"Trong tương quan, ngược lại, chúng tôi quan tâm phần lớn đến việc hai biến phụ thuộc lẫn nhau hay đồng biến - nghĩa là khác nhau. Chúng tôi không biểu thị một biến như một chức năng của biến kia."
Sokal, RR và FJ Rohlf, 1969. Sinh trắc học. Freeman và Co.
Từ góc độ ngữ nghĩa, một mục tiêu thay thế là xây dựng bằng chứng cho một mô hình dự đoán tốt thay vì chứng minh nhân quả. Một thủ tục đơn giản để xây dựng bằng chứng cho giá trị tiên đoán của mô hình hồi quy là chia dữ liệu của bạn thành 2 phần và khớp với hồi quy của bạn với một phần dữ liệu và với phần còn lại của kiểm tra dữ liệu dự đoán nó tốt như thế nào.
Khái niệm nhân quả Granger là thú vị.
trong đó Var (.) và Cov (.) là ước tính từ mẫu (dữ liệu).
Do đó, bản thân các tham số này không có gì khác ngoài một số hàm tương quan giữa x và y. Đặc biệt, beta chỉ là một hệ số tương quan "bình thường hóa". Vì vậy, không có ngụ ý nhân quả trong hồi quy hơn là tương quan. Hồi quy nguyên nhân là một kỹ thuật đặc biệt trong kinh tế lượng, trong đó người ta sẽ phải dựa vào các biến công cụ, ví dụ như để giải quyết các hiện tượng như gây nhiễu làm che khuất sự giải thích nguyên nhân của bất kỳ mô hình hồi quy cụ thể nào.
Quan điểm của tôi là: hồi quy có thể được thực hiện theo nguyên nhân nhưng nó không phải là mặc định y.
Để biết thêm, hãy xem các video này: https://www.youtube.com/watch?v=Sqy_b5OSiXw&list=PLwJRxp3blEvaxmHgI2iOzNP6KGLSyd4dz&index=55&t=0s
"Mô hình Rubin" của chính Rubin: http://www.stat.columbia.edu/~cook/qr33.pdf
Khóa học giới thiệu tuyệt vời về quan hệ nhân quả (mặc dù, chưa có hồi quy nào): https://www.coursera.org/learn/crash-cference-in-causality
Sự hiểu biết của tôi (Tôi là người mới bắt đầu nhân quả) là như sau:
Hồi quy tuyến tính hàm ý nhân quả nếu các đồng biến của bạn là từ một thử nghiệm được kiểm soát và thử nghiệm của bạn phân lập tốt yếu tố nguyên nhân được đưa ra giả thuyết (xem Hồi quy tuyến tính và quan hệ nhân quả trong một thử nghiệm ngẫu nhiên có kiểm soát ).
Hồi quy ĐÁNH GIÁ một mối quan hệ nhân quả .... nếu không có cơ sở cho quan hệ nhân quả là kết quả của phân tích vật lý / trí tuệ / khoa học của vấn đề, thì không có cơ sở để phân tích nguyên nhân và không có cơ sở cho hồi quy. Đây là lý do tại sao FDA và các cơ quan chính phủ tương tự luôn tuyên bố "Điều này gây ra điều đó!" chỉ để rút lại năm và thiệt hại hàng tỷ đô la, sau đó. Ví dụ như quân đoàn: cà phê, sô cô la, caffeine, thịt xông khói, trứng, v.v ....
Tệ hơn nữa là khi hai biến có vòng phản hồi. Một người có thể gây ra điểm khác tại một điểm; chỉ cho người khác gây ra một, sau này. Điều này luôn xảy ra trong lĩnh vực kinh tế của tôi: đó là lý do tại sao hầu hết các phân tích kinh tế không xứng đáng với bài báo được in.