Không có mối tương quan ngụ ý không có quan hệ nhân quả?


73

Tôi biết rằng sự tương quan không ngụ ý nhân quả nhưng sự vắng mặt của mối tương quan có nghĩa là không có nhân quả?


46
Để trích dẫn Andrew Gelman, "Tương quan thậm chí không ngụ ý tương quan."
Mike Hunter

9
Số A có thể là nguyên nhân của B, nhưng chỉ ảnh hưởng đến nó phi tuyến.
Neil G

3
"Tương quan tương quan với quan hệ nhân quả. (Chỉ là không nhiều lắm.)"
Adrian

7
Xin vui lòng nhìn vào trang này cho các contrapositive. Nếu quan hệ nhân quả không ngụ ý tương quan, thì không có mối tương quan nào không ngụ ý không có quan hệ nhân quả.
EdM

4
Mặc dù đó là một khởi đầu tốt để đánh dấu mối tương quan đó không bao hàm mối quan hệ nhân quả, và sau đó thảo luận chi tiết, từ lâu tôi đã nghĩ tại sao lại bỏ qua mối tương quan? Tôi đặt nó xuống để đồng điệu, và ý tưởng hấp dẫn các giáo viên (tôi cũng vậy) rằng các sinh viên với một số nỗ lực có thể nhớ một khẩu hiệu và sử dụng nó trong suy nghĩ của họ. Nhưng sự thật là, không nhiều trong thống kê ngụ ý nhân quả. Mặt khác, cảnh báo này thường đi kèm trong chương tương quan hoặc bài giảng tương quan, nhưng nó thuộc về mọi nơi.
Nick Cox

Câu trả lời:


76

không có sự tương quan có nghĩa là không có quan hệ nhân quả?

Không. Bất kỳ hệ thống được kiểm soát nào cũng là một ví dụ.

Không có kiểm soát mối quan hệ nhân quả rõ ràng là không thể, nhưng có nghĩa là kiểm soát thành công - nói một cách đại khái - rằng một số lượng đang được duy trì không đổi, điều đó ngụ ý rằng nó sẽ không tương quan với bất cứ điều gì, kể cả bất cứ điều gì khiến nó không đổi.

Vì vậy, trong tình huống này, kết luận không có mối quan hệ nhân quả từ thiếu tương quan sẽ là một sai lầm.

Đây là một ví dụ điển hình .


Một cách trực quan để suy nghĩ về nó
Repmat

+1, lấy thú vị. Tuy nhiên, nó dường như ngụ ý rằng quan hệ nhân quả có thể có mặt trong khi mối tương quan của bất kỳ loại nào là không có. Điều đó không thể đúng. Nếu một sự kiện nào đó gây ra sự kiện khác, sẽ có một số "hiện tại tương quan, tht _constant mà bạn đã đề cập sẽ ở dạng tương quan phi tuyến
Aksakal

1
+1 áo ngực ! Khi tôi nhìn thấy tiêu đề câu hỏi trong thanh bên, tôi chỉ toàn là "Điều này cần trả lời từ góc độ hệ thống." Bạn đóng đinh nó.
Alexis

Nếu từ một sự vắng mặt của mối tương quan, người ta sẽ loại bỏ tính nhân quả thì chức năng còn lại sẽ là ứng cử viên cho nhãn "ngẫu nhiên"?
ttnphns

1
Không chắc là tôi hiểu câu hỏi của @ ttnphns, nhưng tôi nghĩ câu trả lời là: nếu bạn giật cáp phanh (hoặc tháo bàn đạp ga) thì đồi thực sự sẽ bắt đầu cho thấy tác động nhân quả của chúng đối với tốc độ của xe.
liên hợp chiến

30

Không. Chủ yếu là bởi vì tương quan bạn rất có thể có nghĩa là tương quan tuyến tính . Hai biến có thể tương quan phi tuyến và có thể không hiển thị tương quan tuyến tính . Thật dễ dàng để xây dựng một ví dụ như vậy, nhưng tôi sẽ đưa ra một ví dụ gần với câu hỏi (hẹp hơn) của bạn.

Chúng ta hãy xem biến ngẫu nhiên và hàm không ngẫu nhiên , với đó chúng ta tạo một biến ngẫu nhiên . Cái sau rõ ràng là do biến trước, không chỉ tương quan. Hãy vẽ một cốt truyện phân tán:xf(x)=x2y=f(x)

nhập mô tả hình ảnh ở đây

Đẹp, hình ảnh tương quan phi tuyến rõ ràng , nhưng trong trường hợp này nó cũng là nhân quả trực tiếp. Tuy nhiên, hệ số tương quan tuyến tính là không đáng kể, nghĩa là không có tương quan tuyến tính mặc dù có mối tương quan phi tuyến rõ ràng và thậm chí cả quan hệ nhân quả:

>> x=randn(100,1);
>> y=x.^2;
>> scatter(x,y)
>> [rho,pval]=corr(x,y)

rho =

    0.0140


pval =

    0.8904

CẬP NHẬT: @Kodiologist là đúng trong bình luận. Về mặt toán học có thể chỉ ra rằng hệ số tương quan tuyến tính cho hai biến này thực sự bằng không. Trong ví dụ của tôi là biến thông thường tiêu chuẩn, vì vậy chúng tôi có các biến sau: Do đó, hiệp phương sai (và sau đó là tương quan) bằng 0: x

E[x]=0
E[x2]=1
E[xx2]=E[x3]=0
Cov[x,x2]=E[xx2]E[x]E[x2]=0

Chúng tôi sẽ nhận được kết quả tương tự cho bất kỳ phân phối đối xứng nào, chẳng hạn như thống nhất .U[1,1]


8
Không quan trọng không ngụ ý sự thật của giả thuyết null. Điều quan trọng trong ví dụ của bạn là hệ số tương quan dân số là 0.
Nhà khoa học Kodi

1
Tại sao bạn tin rằng OP có nghĩa là tương quan tuyến tính?
dùng253751

@immibis, vì quan hệ nhân quả phải dẫn đến một số loại tương quan phi tuyến.
Aksakal

Tại sao mối tương quan bằng không? Hiệp phương sai là , và nói chung cho một biến ngẫu nhiên thì .. Nó giữ cho tiêu chuẩn bình thường mặc dùE[X3]E[X2]E[X]XE[X3]E[X2]E[X]X
Ant

@Ant, tôi đang sử dụng tiêu chuẩn bình thường cho trong ví dụ MATLAB. Tôi cập nhật bài viết của mình để làm cho nó rõ ràng. Cảm ơn đã chỉ ra điều đó. x
Aksakal

18

Không . Cụ thể, các biến ngẫu nhiên có thể phụ thuộc nhưng không tương quan.

Đây là một ví dụ. Giả sử tôi có một máy lấy một đầu vào và tạo ra một số ngẫu nhiên , bằng với hoặc với xác suất bằng nhau. Rõ ràng gây . Bây giờ hãy để là một biến ngẫu nhiên được phân phối đồng đều trên và chọn với , tạo ra phân phối chung trên . và phụ thuộc, vìx[1,1]YxxY X [ - 1 , 1 ] Y x = X ( X , Y ) X YxYX[1,1]Yx=X(X,Y)XY

P(X<12)P(|Y|<12)=1412=180=P(X<12,|Y|<12).

Tuy nhiên, tương quan của và là 0, bởi vìYXY

Corr(X,Y)=Cov(X,Y)σXσY=E[XY]E[X]E[Y]σXσY=000σXσY=0.

1
Trên thực tế, đây là một ví dụ xấu theo ý kiến ​​của tôi. X không gây ra Y. Một biến nhị phân vắng mặt của mô hình PresenceOfX là nguyên nhân thực tế có tương quan 1. Điều bạn chứng minh thực sự là giá trị của X không ảnh hưởng đến Y.
user2088176

6
Tôi thực sự lúng túng cho cách bạn có thể cảm thấy rằng sự lựa chọn của không gây . Có lẽ bạn nên xác định những gì bạn có nghĩa là "nguyên nhân". xY
Kodiologist

5
@ user2088176 Dưới đây là một bằng chứng nhanh chóng mà lựa chọn gây . Hãy sử dụng một mô hình đối chứng nhân quả, trong đó là một chỉ số vào một tập hợp các bản phân phối có thể cho . Nếu , thì là hoặc với xác suất bằng nhau. Nếu , thì là hoặc với xác suất bằng nhau. Do các tác dụng phụ được phân biệt bởi giá trị của ngụ ý phân phối riêng cho , nên việc chọn nguyên nhânxYxYx=12Y1212x=34Y3434xYxY .
Kodiologist

1
Ví dụ này có lẽ sẽ đơn giản hơn (và vẫn hoạt động) nếu chúng ta giới hạn ở . x[0,1]
JiK

3
Điều gì về ví dụ đơn giản và tiêu chuẩn: và . Họ là không tương quan nhưng -distributed là hoàn toàn phụ thuộc vào . XN(0,1)X2χ2(1)X2X
Therkel

14

Có lẽ nhìn vào nó từ một quan điểm tính toán sẽ giúp.

Để làm ví dụ cụ thể, hãy sử dụng trình tạo số giả ngẫu nhiên.

Có mối quan hệ nhân quả giữa hạt giống bạn đặt và đầu ra từ trình tạo không?kth

Có bất kỳ mối tương quan có thể đo lường?


7

Câu trả lời tốt hơn cho câu hỏi là mối tương quan là mối quan hệ thống kê, toán học và / hoặc vật lý trong khi quan hệ nhân quả là mối quan hệ siêu hình. Bạn không thể GIAO DỊCH từ tương quan (hoặc không tương quan) đến quan hệ nhân quả, mà không có một tập hợp giả định (lớn) ràng buộc siêu hình học với vật lý. (Một ví dụ là những gì hai người có thể đồng ý là "một người quan sát hợp lý" là ở mức độ lớn tùy tiện và có thể mơ hồ). Nếu A trả tiền cho B để làm C dẫn đến D, nguyên nhân của D là gì? Đơn giản là không có lý do hợp lý để chọn C hoặc B hoặc A (hoặc bất kỳ sự kiện tiền thân nào của A). Lý thuyết điều khiển liên quan đến các hệ thống trong các lĩnh vực nơi chúng được kiểm soát. Một cách để có được một biến phụ thuộc dưới sự kiểm soát là giảm đáp ứng của biến đó với phạm vi biến đổi (được kiểm soát) có thể có của biến độc lập với nhiễu thống kê. Chẳng hạn, chúng ta biết áp suất không khí có liên quan đến sức khỏe (chỉ cần thử thở chân không), nhưng nếu chúng ta kiểm soát áp suất không khí đến 1 +/- 0,001 atm, thì khả năng BẤT K change biến đổi áp suất không khí nào ảnh hưởng đến sức khỏe?


Sự khác biệt mà bạn theo sau là 'được quan sát trong một mẫu' (tương quan) so với sự phụ thuộc tồn tại dù nó có được quan sát trong mẫu (vật lý) hay không. Không có vai trò nào cho siêu hình học trong lời giải thích này (mặc dù một số cho giả định vật lý). Lò xo có giới hạn đàn hồi cho dù chúng có bao giờ chạm tới chúng hay không. Hoặc trong một ví dụ đơn giản hơn: một viên đường có thể hòa tan - một khái niệm nhân quả rõ ràng ngụ ý, đại khái, rằng nếu bạn thả nó vào trà, nó sẽ tan. Nhưng tài sản nhân quả này hoàn toàn là do cấu trúc vật lý của nó . Khối đường sẽ hòa tan ngay cả khi chúng ta không bao giờ nghĩ sẽ hòa tan bất kỳ trong số chúng.
liên hợp chiến

1
Tất nhiên, bạn đúng, nếu không có các giả định nguyên nhân thành một cuộc tranh luận, bạn không nhận được kết luận nguyên nhân từ đó. Nhưng thực sự không có gì siêu hình về điều đó!
liên hợp chiến

fwiw lý thuyết nhân quả trái ngược (ví dụ Pearl hoặc Woodward) được thiết kế chính xác để hiểu "Nếu A trả B để làm C dẫn đến D, nguyên nhân của D là gì? Đơn giản là không có lý do hợp lý nào để chọn C hoặc B hoặc A" . Các chỉ khái niệm lỗi thời cũ và khái niệm vô ích rằng những lý thuyết đưa vào phần còn lại là chúng ta luôn luôn có thể làm cho Sene của ý tưởng rằng có những nguyên nhân gây ra cái gì đó. Tất nhiên là không có.
liên hợp chiến

5

Vâng , trái với trả lời trước. Tôi sẽ đặt câu hỏi là không khoa học, đặc biệt là định nghĩa của "tương quan". Có lẽ tôi đang sử dụng nó quá rộng, nhưng hãy xem viên đạn thứ hai của tôi. Tôi hy vọng nó sẽ được coi là thích hợp để thảo luận về các câu trả lời khác ở đây, bởi vì chúng chiếu sáng các phần khác nhau của câu hỏi. Tôi đang vẽ về cách tiếp cận quan hệ nhân quả của Pearl, và đặc biệt là tôi sẽ đưa nó vào một số bài báo với Kevin Korb. Woodward có lẽ có tài khoản phi kỹ thuật rõ ràng nhất.

  • @conjugatep Warrior nói "bất kỳ hệ thống được kiểm soát nào cũng là một ví dụ". Vâng, với tuyên bố mạnh mẽ hơn rằng sự không tương quan quan sát được trong thí nghiệm của bạn ngụ ý không có nguyên nhân. Tôi sẽ giả sử câu hỏi là tổng quát hơn. Chắc chắn một thí nghiệm có thể đã thất bại trong việc kiểm soát các nguyên nhân che giấu hoặc kiểm soát không phù hợp các tác động phổ biến và che giấu mối tương quan. Nhưng nếu gây ra , sẽ có một thử nghiệm được kiểm soát trong đó mối quan hệ đó được tiết lộ. Hầu như tất cả các định nghĩa hoặc tài khoản của quan hệ nhân quả coi nó như một sự khác biệt tạo nên sự khác biệt. Do đó, không có quan hệ nhân quả mà không có (một số loại) tương quan. Nếu có một liên kết trực tiếp trong mạng Bayes nhân quả, điều đó không có nghĩa làxyxyx luôn tạo ra sự khác biệt cho , chỉ có một số thí nghiệm sửa tất cả các nguyên nhân khác của trong đó wiggling wiggles .yyxy

  • @aksakal có một ví dụ tuyệt vời tại sao quan hệ nhân quả tuyến tính là không đủ. Đồng ý, nhưng tôi muốn được rộng rãi và không kỹ thuật. Nếu , sẽ không đầy đủ để nói với khách hàng rằng không tương thích với . Vì vậy, tôi sẽ sử dụng tương quan rất rộng để có nghĩa là một sự khác biệt trong có liên quan đáng tin cậy với một sự khác biệt trong . Nó có thể là phi tuyến hoặc không theo tỷ lệ như bạn muốn. Hiệu ứng ngưỡng là tốt ( tạo ra sự khác biệt cho , nhưng chỉ trong một phạm vi hữu hạn hoặc chỉ bằng cách lớn hơn hoặc nhỏ hơn một giá trị cụ thể, như điện áp trong các mạch kỹ thuật số). y x x y x yy=x2yxxyxy

  • @Kodiologist tạo một ví dụ trong đó , vì vậynhưng không có tương quan tuyến tính. Nhưng rõ ràng có một mối quan hệ có thể khám phá, do đó, tương quan theo nghĩa rộng.| y | = | x |y=Unif(x,x)|y|=|x|

  • @Szabolcs sử dụng các trình tạo số ngẫu nhiên để hiển thị một luồng đầu ra được xây dựng để xuất hiện không tương thích. Giống như các chữ số của , luồng xuất hiện ngẫu nhiên nhưng mang tính xác định. Tôi đồng ý rằng bạn không thể tìm thấy mối quan hệ nếu chỉ cung cấp dữ liệu, nhưng nó ở đó.π

  • @Li Zi lưu ý bạn không thể nhảy một cách hợp lý từ mối tương quan sang quan hệ nhân quả. Có, không có nguyên nhân trong, không có nguyên nhân ra. Nhưng câu hỏi bắt đầu từ quan hệ nhân quả: nó có ngụ ý tương quan không? Trong ví dụ áp suất không khí, chúng ta có hiệu ứng ngưỡng. Có một phạm vi mà áp suất không khí không tương thích với sức khỏe. Quả thực là hợp lý khi nó không có tác dụng nhân quả đối với sức khỏe. Nhưng có một phạm vi mà nó làm. Thế là đủ. Nhưng có lẽ tốt hơn để lưu ý phạm vi nơi có và không phải là một hiệu ứng. Nếu , thì có mối tương quan tất cả dọc theo chuỗi, bởi vì có mối quan hệ nhân quả. Quan sát lặp lại (hoặc thử nghiệm) có thể cho thấy không trực tiếp gây raA DABCDAD nhưng mối tương quan là có bởi vì có một câu chuyện nhân quả.

Tôi không biết @ user2088176 có ý nghĩ gì, nhưng tôi nghĩ rằng nếu chúng ta đưa ra câu hỏi rất chung chung, thì câu trả lời là có. Ít nhất tôi nghĩ đó là câu trả lời cần có của tài liệu khám phá nhân quả và tài khoản can thiệp về nguyên nhân. Nguyên nhân là sự khác biệt tạo nên sự khác biệt. Và sự khác biệt đó sẽ được tiết lộ, trong một số thí nghiệm, là sự liên kết bền bỉ.


1
Tôi đã hy vọng tiếp cận điều này từ một quan điểm đơn giản hơn và phi kỹ thuật, như bạn có. "Nguyên nhân" nghĩa là gì? Có lẽ nó liên quan đến sự thay đổi trong một cái gì đó dẫn đến một sự thay đổi trong một cái gì đó khác. Tôi không thể hiểu nhân quả mà không có một số loại tương quan.
Behacad

1
@Behacad Tôi nghĩ rằng sự tương phản là giữa một số loại tương quan (loại điều bạn có thể quan sát) và một số loại phụ thuộc (có thể không bao giờ được kích hoạt). Có những phụ thuộc không được ghi nhận nhưng không có mối tương quan không quan sát được. Đây là lý do tại sao quan hệ nhân quả có một yếu tố phản tác dụng với định nghĩa của nó, trong khi tương quan thì không.
liên hợp chiến
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.