Liệu quan hệ nhân quả có ngụ ý tương quan?


118

Tương quan không ngụ ý nhân quả, vì có thể có nhiều giải thích cho mối tương quan. Nhưng quan hệ nhân quả có ngụ ý tương quan? Theo trực giác, tôi sẽ nghĩ rằng sự hiện diện của quan hệ nhân quả có nghĩa là nhất thiết phải có một số mối tương quan. Nhưng trực giác của tôi không phải lúc nào cũng phục vụ tôi tốt trong thống kê. Liệu quan hệ nhân quả có ngụ ý tương quan?


5
Vấn đề là, nếu bạn tra cứu "ngụ ý" trong từ điển, bạn sẽ thấy cả "gợi ý" và "bắt buộc".
rolando2

6
Tương quan không ngụ ý nhân quả, nhưng nó vẫy lông mày một cách khêu gợi và cử chỉ lén lút trong khi nói 'nhìn qua đó'. xkcd.com/552
jchristie

1
Bản thân câu hỏi dường như không tìm kiếm một câu trả lời cụ thể, thực tế, như được chỉ ra bằng cách sử dụng từ này. Các tài liệu tham khảo ở trên giống như một cuối cùng có thể. Hoặc giống như có lẽ nhưng tôi không thể chứng minh điều đó.
jchristie

Câu trả lời:


96

Như nhiều câu trả lời ở trên đã nêu, quan hệ nhân quả không bao hàm mối tương quan tuyến tính . Do rất nhiều khái niệm tương quan đến từ các lĩnh vực phụ thuộc nhiều vào thống kê tuyến tính, nên thông thường tương quan được xem là tương đương với tương quan tuyến tính. Các bài viết wikipedia là nguồn cung cấp ổn cho điều này, tôi thực sự thích hình ảnh này:

Ví dụ tương quan

Nhìn vào một số hình ở hàng dưới cùng, ví dụ hình parabola-ish trong ví dụ thứ 4. Đây là loại những gì xảy ra trong câu trả lời @StasK (với một chút tiếng ồn được thêm vào). Y có thể được gây ra hoàn toàn bởi X nhưng nếu mối quan hệ số không phải là tuyến tính và đối xứng, bạn vẫn sẽ có tương quan bằng 0.

Từ bạn đang tìm kiếm là thông tin lẫn nhau : đây là loại phiên bản tương quan phi tuyến tính chung. Trong trường hợp đó, tuyên bố của bạn sẽ là đúng: quan hệ nhân quả ngụ ý thông tin lẫn nhau cao .


3
Thông thường nhưng không phải lúc nào cũng đúng là thông tin lẫn nhau cao đi kèm với quan hệ nhân quả. Xem câu trả lời của @ gung trong đó "nếu nguyên nhân hoàn toàn tương quan với một biến nhân quả khác với hiệu ứng ngược lại."
Neil G

5
Việc tranh luận về hai nguyên nhân có tác động ngược nhau luôn hủy bỏ lẫn nhau không có ý nghĩa gì với tôi như một nguyên nhân . Tôi luôn có thể cho rằng có những con kỳ lân gây ra điều gì đó, và gremlins hủy bỏ những nỗ lực của họ một cách hoàn hảo; Tôi tránh điều này vì nó ngớ ngẩn. Nhưng có lẽ tôi đang hiểu nhầm quan điểm của bạn.
Artem Kaznatcheev

11
A,BCABCC=A+BBACB

2
@NielG Tôi đồng ý với câu đầu tiên của bạn, nhưng không phải câu thứ hai. Chỉ vì A & B gây ra C, không có nghĩa là A gây ra C và B gây ra C. Tôi không hiểu tại sao nguyên nhân phải phân phối trên &.
Artem Kaznatcheev

4
Lý do mà A vẫn là nguyên nhân của C là vì thay đổi A vẫn sẽ thay đổi C. Vì vậy, C phụ thuộc vào A ngay cả khi chúng ta không quan sát B.
Neil G

41

Câu trả lời nghiêm ngặt là "không, quan hệ nhân quả không nhất thiết ngụ ý tương quan".

XN(0,1)Y=X2χ12XYXYE[X]=0E[Y]=E[X2]=1

Cov[X,Y]=E[(X0)(Y1)]=E[XY]E[X]1=E[X3]E[X]=0
sử dụng thuộc tính của phân phối chuẩn thông thường rằng các khoảnh khắc lẻ của nó đều bằng 0 (có thể dễ dàng bắt nguồn từ hàm tạo mô men của nó, giả sử). Do đó, mối tương quan bằng không.

XN(0,1)(10,10)exp(|x|)XXXXYXN(3,1)E[X]=3E[Y]=E[X2]=10E[X3]=36Cov[X,Y]=E[XY]E[X]E[Y]=3630=60XXXYχ2; bạn có thể lấy phương sai từ trang Wikipedia và tính toán tương quan nếu bạn quan tâm.)


2
@DQdlM: Biến ngẫu nhiên tiêu chuẩn có biến mất các khoảnh khắc trung tâm kỳ lạ , do sự đồng đều của mật độ. Matthew: Câu trả lời là không, như StasK đã chứng minh, bởi vì mối tương quan không phải là loại phụ thuộc duy nhất.
Emre

3
XN(3,1)

3
PS tôi rất vui vì bạn đã đăng câu trả lời này. Thật khó tin câu hỏi đã đi quá lâu mà không có câu trả lời này. Đây là ví dụ chính xác xuất hiện trong đầu tôi khi tôi thấy câu hỏi này, nhưng không có thời gian để viết nó lên. Tôi rất vui vì bạn đã dành thời gian. Chúc mừng.
Đức hồng y

3
@cardinal: yeah, tôi đoán rằng tất cả chúng ta đã học được những loại phản ứng đơn giản này ở trường học ... và vâng, từ đạo hàm của hiệp phương sai, bạn chỉ cần khoảnh khắc thứ nhất và thứ ba là số không. Nếu bạn có một ví dụ không tầm thường về phân phối bất đối xứng có thời điểm thứ ba bằng không (khối lượng xác suất được điều chỉnh chính xác trên năm hoặc sáu điểm không được tính), tôi sẽ rất tò mò muốn xem nó.
StasK

3
XYfY=f(X)

31

Về cơ bản, có.

Tương quan không ngụ ý nhân quả bởi vì có thể có những giải thích khác cho một mối tương quan ngoài nguyên nhân. Nhưng để A là nguyên nhân của B, chúng phải được liên kết theo một cách nào đó . Có nghĩa là có một mối tương quan giữa chúng - mặc dù mối tương quan đó không nhất thiết phải là tuyến tính.

Như một số nhà bình luận đã đề xuất, có thể thích hợp hơn để sử dụng một thuật ngữ như 'phụ thuộc' hoặc 'liên kết' thay vì tương quan. Mặc dù như tôi đã đề cập trong các bình luận, tôi đã thấy "tương quan không có nghĩa là nhân quả" để đáp ứng với phân tích vượt xa tương quan tuyến tính đơn giản, và vì vậy, với mục đích của câu nói, về cơ bản tôi đã mở rộng "tương quan" với bất kỳ liên kết giữa A và B.


16
Tôi có xu hướng bảo lưu mối tương quan từ cho tương quan tuyến tính và sử dụng sự phụ thuộc cho các mối quan hệ phi tuyến có thể có hoặc không có tương quan tuyến tính.
Ghi nhớ

4
@Memming Tôi cũng vậy, tiết kiệm cho thực tế là mọi người nói ra "Tương quan không ngụ ý nhân quả" re: hiệp hội phi tuyến tính khá phức tạp.
Fomite

Ghi nhớ là đúng. Bạn cần xác định mối tương quan nếu bạn không có nghĩa là tương quan Pearson.
Neil G

1
@NeilG Hoặc đối với vấn đề đó, người ta có thể có được mối tương quan Pearson tuyến tính bằng cách chuyển đổi một biến này hoặc biến khác. Vấn đề là bản thân câu ngạn ngữ đã được đơn giản hóa quá mức.
Fomite

1
@EpiGrad: Cả hai điểm tốt. Theo cách nói thông thường, mối tương quan chỉ là nhiều hơn A trùng với nhiều B. Tôi nghĩ rằng câu trả lời của bạn sẽ có lợi từ việc sử dụng một định nghĩa rộng về tương quan rõ ràng.
Neil G

23

Thêm vào câu trả lời của @EpiGrad. Tôi nghĩ, đối với nhiều người, "tương quan" sẽ bao hàm "tương quan tuyến tính". Và khái niệm về tương quan phi tuyến có thể không trực quan.

Vì vậy, tôi sẽ nói "không họ không cần phải tương quan nhưng họ phải có liên quan ". Chúng tôi đồng ý về chất này, nhưng không đồng ý về cách tốt nhất để có được chất đó.

Một ví dụ về quan hệ nhân quả như vậy (ít nhất là mọi người nghĩ rằng đó là nguyên nhân) là giữa khả năng trả lời điện thoại và thu nhập của bạn. Được biết, những người ở cả hai đầu của phổ thu nhập ít có khả năng trả lời điện thoại của họ hơn những người ở giữa. Người ta cho rằng mô hình nhân quả là khác nhau đối với người nghèo (ví dụ như người thu tiền hóa đơn) và người giàu (ví dụ: tránh người yêu cầu quyên góp).


21

XY

Hãy xem xét mô hình nhân quả sau:

XYU

XUY

Bây giờ hãy để:

Xbernoulli(0.5)Ubernoulli(0.5)Y=1XU+2XU

UP(Y|X)=P(Y)XYYX

XUYXUXYUY {X,U}YXYXYXYXYU

Vì vậy, trong ngắn hạn, tôi sẽ nói rằng: (i) nhân quả cho thấy sự phụ thuộc; nhưng, (ii) sự phụ thuộc là sự phụ thuộc về chức năng / cấu trúc và nó có thể hoặc không thể dịch theo sự phụ thuộc thống kê cụ thể mà bạn đang nghĩ đến.


Carlos, thật đúng khi nói rằng nếu chúng ta biết toàn bộ các biến liên quan đến mô hình nguyên nhân thì vấn đề này (tàng hình thống kê) sẽ biến mất?
markowitz

@markowitz bạn sẽ cần phải quan sát mọi thứ đến mức xác định, do đó không phải là một kịch bản rất thực tế.
Carlos Cinelli

Tôi diễn giải câu trả lời của bạn là có Bạn nói đúng, tình huống mà tôi cho là không thực tế; Tôi biết về nó. Tuy nhiên, câu hỏi chỉ liên quan đến logic mà bạn mô tả và tính hữu hạn là nắm bắt nó. Niềm tin của tôi là một cái gì đó giống như quan hệ nhân quả của người Hồi giáo ngụ ý hiệp hội thống kê và những câu trả lời khác trong trang này nghe có vẻ như thế này. Sau tất cả, ví dụ của bạn là hơi phi thực tế nhưng không phải vì lý do này trong việc không quan tâm. Dường như với tôi rằng, nói chung, quan hệ nhân quả không có liên kết thống kê là hơi phi thực tế nhưng về mặt lý thuyết thú vị.
markowitz

1
@markowitz "tàng hình thống kê" xảy ra khi mô hình không trung thành với biểu đồ. Để hủy bỏ chính xác, điều này phụ thuộc vào một sự lựa chọn cụ thể của tham số hóa, vì vậy một số người cho rằng nó thực sự không thể. Tuy nhiên, việc hủy gần có thể hợp lý vì nó phụ thuộc vào một vùng các tham số, vì vậy tất cả phụ thuộc vào ngữ cảnh. Vấn đề ở đây chỉ là bạn cần phải làm cho các giả định nguyên nhân của mình rõ ràng bởi vì, về mặt logic, quan hệ nhân quả không bao hàm sự liên kết của chính nó - bạn cần thêm các giả định.
Carlos Cinelli

13

Nguyên nhân và ảnh hưởng sẽ được tương quan trừ khi không có sự thay đổi nào cả về tỷ lệ và cường độ của các nguyên nhân và không có sự thay đổi ở tất cả trong lực lượng nhân quả của nó. Các chỉ khả năng khác sẽ là nếu nguyên nhân là hoàn toàn tương quan với một biến hệ nhân quả với chính xác tác dụng ngược lại. Về cơ bản, đây là những điều kiện thí nghiệm suy nghĩ. Trong thế giới thực, quan hệ nhân quả sẽ bao hàm sự phụ thuộc dưới một hình thức nào đó (mặc dù nó có thể không phải là tương quan tuyến tính ).


3
@NeilG, tôi đam mê chữ nghiêng của mình .
gung

1
Một số lý thuyết thực sự ngụ ý điều này, ví dụ như nhiều mô hình lý thuyết trò chơi. Một số tình huống thực nghiệm trong đó bạn không thể nhận ra sự khác biệt (mặc dù thực tế sẽ có một 'in gung-italics' như sau :-) bao gồm 'trung lập' không có kịch bản thay đổi gen khi áp lực chọn lọc tiến hóa ở hai cấp độ khác nhau.
liên hợp chiến

1
Tôi thích ngoại lệ thứ nhất, nhưng không phải ngoại lệ thứ hai. Tôi thích nghĩ rằng việc lật công tắc sẽ khiến đèn sáng, nhưng nếu tôi tình cờ chỉ bật công tắc trong khi mất điện thì không có gì xảy ra. Có lẽ không thực sự có mối quan hệ nhân quả.
emory

1
@ naught101, bạn nêu lên một điểm tốt, đã được thảo luận ở nơi khác trên trang này. Tôi đã chỉnh sửa câu trả lời của tôi. Tuy nhiên, khi tôi làm việc với mọi người, tôi không nghĩ họ có quan niệm mạnh mẽ về mối tương quan là nhất thiết phải tuyến tính, mặc dù tôi nói với họ điều đó. Mặc dù họ sẽ không đặt nó trong các điều khoản này, tôi nghĩ rằng hầu hết mọi người đều hiểu "tương quan" gần với "chức năng của" hơn. Tuy nhiên, tôi nên rõ ràng hơn trong việc sử dụng thuật ngữ của mình và nên bắt đầu từ đầu.
gung

2
@emory: nguyên nhân của ánh sáng bật lên thực sự là do đóng mạch điện (nguyên nhân là do sự bật của công tắc, với các điều kiện môi trường bao gồm cả lưới điện hoạt động). Trong thời gian mất điện, bật công tắc không đóng mạch, vì nó bị hỏng ở nơi khác. Vì vậy, theo một nghĩa nào đó, mất điện là hiệu ứng "ngược lại" mà gung đang nói đến (tức là đèn sáng, màn hình tắt nó đi). Nó cũng có thể được coi là một hiệu ứng vô hiệu hóa.
ness101

2

Có câu trả lời tuyệt vời ở đây. Artem Kaznatcheev , FomitePeter Flom chỉ ra rằng quan hệ nhân quả thường sẽ bao hàm sự phụ thuộc hơn là tương quan tuyến tính. Carlos Cinelli đưa ra một ví dụ khi không có sự phụ thuộc, vì cách thiết lập chức năng tạo.

Tôi muốn thêm một điểm về cách sự phụ thuộc này có thể biến mất trong thực tế, trong các loại bộ dữ liệu mà bạn có thể làm việc tốt. Các tình huống như ví dụ của Carlos không chỉ giới hạn ở "điều kiện thử nghiệm suy nghĩ".

Sự phụ thuộc tan biến trong các quá trình tự điều chỉnh . Cân bằng nội môi, ví dụ, đảm bảo rằng nhiệt độ bên trong cơ thể bạn không phụ thuộc vào nhiệt độ phòng. Nhiệt bên ngoài ảnh hưởng trực tiếp đến nhiệt độ cơ thể của bạn, nhưng nó cũng ảnh hưởng đến hệ thống làm mát của cơ thể (ví dụ như đổ mồ hôi) giúp giữ nhiệt độ cơ thể ổn định. Nếu chúng ta lấy mẫu nhiệt độ trong những khoảng thời gian cực nhanh và sử dụng các phép đo cực kỳ chính xác, chúng ta có cơ hội quan sát sự phụ thuộc nguyên nhân, nhưng ở tốc độ lấy mẫu bình thường, nhiệt độ cơ thể và nhiệt độ bên ngoài có vẻ độc lập.

Các quá trình tự điều chỉnh là phổ biến trong các hệ thống sinh học; chúng được sản xuất bởi sự tiến hóa. Động vật có vú không điều chỉnh nhiệt độ cơ thể của chúng được loại bỏ bằng cách chọn lọc tự nhiên. Các nhà nghiên cứu làm việc với dữ liệu sinh học nên biết rằng sự phụ thuộc nguyên nhân có thể biến mất trong bộ dữ liệu của họ.


-3

Sẽ không một nguyên nhân mà không có bất kỳ mối tương quan là một rng?

Trừ khi, giống như câu trả lời được chấp nhận, bạn đang sử dụng một cách giải thích cực kỳ hạn chế của từ 'tương quan', đó là một câu hỏi ngớ ngẩn - nếu một điều 'gây ra' khác, thì theo một cách nào đó, nó bị ảnh hưởng bởi nó. tăng dân số, hoặc chỉ cường độ.

đúng?

Sau đó, một lần nữa, bạn có thể thảo luận về một cái gì đó giống như, tầm nhìn của thứ gì đó bị ảnh hưởng bởi thứ khác, mà tôi đoán sẽ giống như nguyên nhân, nhưng thực sự bạn không đo lường được những gì bạn nghĩ rằng bạn đang đo ...

Vì vậy, vâng, tôi đoán câu trả lời ngắn sẽ là "Có, miễn là bạn không thể tạo ra entropy."

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.