Trong những điều kiện nào tương quan ngụ ý nhân quả?


85

Tất cả chúng ta đều biết câu thần chú "tương quan không ngụ ý nhân quả" mà được đánh trống trong tất cả các sinh viên thống kê năm đầu tiên. Có một số ví dụ hay ở đây để minh họa ý tưởng.

Nhưng đôi khi mối tương quan không ngụ ý nhân quả. Ví dụ sau đây lấy từ trang Wikipedia này

Ví dụ, người ta có thể thực hiện một thí nghiệm trên các cặp song sinh giống hệt nhau, những người được biết là luôn đạt điểm giống nhau trong các bài kiểm tra của họ. Một cặp song sinh được gửi đi học trong sáu giờ trong khi đứa còn lại được gửi đến công viên giải trí. Nếu điểm kiểm tra của họ đột nhiên chuyển hướng bởi một mức độ lớn, đây sẽ là bằng chứng mạnh mẽ cho thấy việc học (hoặc đi đến công viên giải trí) có ảnh hưởng nhân quả đến điểm kiểm tra. Trong trường hợp này, mối tương quan giữa điểm số học tập và kiểm tra gần như chắc chắn ngụ ý nhân quả.

Có những tình huống khác trong đó mối tương quan ngụ ý nhân quả?


16
Mối tương quan và một lý do cơ bản mạnh mẽ cho một liên kết gợi ý quan hệ nhân quả cho đến khi được chứng minh khác đi có lẽ là điều tốt nhất bạn có thể nhận được.
James

8
Không phải Karl Popper đã nói rằng con người không thể thiết lập quan hệ nhân quả: các lý thuyết khoa học là trừu tượng trong tự nhiên. Chúng có thể là giả mạo và thực tế là chúng ta gặp khó khăn trong việc làm sai lệch một cái gì đó khiến chúng ta suy nghĩ về quan hệ nhân quả ...
robin girard

3
Ví dụ phản biện thú vị từ Jaynes: Chúng tôi có mối quan hệ suy diễn "không mây" ngụ ý "không mưa"; nhưng ai có thể tin rằng "không có mây" là nguyên nhân vật lý của "không mưa"?
xác suất

4
Chúng ta hãy sử dụng một thuật ngữ khác với 'ngụ ý' vì trong từ điển nghĩa của nó bao gồm cả 1. Gợi ý và 2. Cần thiết (!)
rolando2

Liệu sinh đôi đó thậm chí có ý nghĩa? Ý tôi là nguyên nhân ngụ ý là sự khác biệt giữa phương pháp / chế độ học tập gây ra sự khác biệt về điểm kiểm tra của cặp song sinh. Nhưng đó là một mẫu của một, và thậm chí với một mẫu lớn, tất cả chỉ cần một cặp sinh đôi có phản ứng ngược lại để phá vỡ giả thuyết, kiểu thiên nga đen ... @probabilityislogic: khái niệm "không có mây" có vật lý không Ý nghĩa? Nếu có, thì tôi không hiểu tại sao phần thứ hai không đáng tin.
ness101

Câu trả lời:


33

Tương quan là không đủ cho quan hệ nhân quả. Người ta có thể đi vòng quanh ví dụ Wikipedia bằng cách tưởng tượng rằng những cặp song sinh đó luôn gian lận trong các bài kiểm tra của họ bằng cách có một thiết bị cung cấp cho họ câu trả lời. Sinh đôi đi đến công viên giải trí bị mất thiết bị, do đó hạng thấp.

Một cách hay để làm cho công cụ này trở nên thẳng thắn là nghĩ về cấu trúc của mạng Bayes có thể tạo ra các đại lượng đo, như được thực hiện bởi Pearl trong cuốn sách Nhân quả của ông . Điểm cơ bản của ông là tìm kiếm các biến ẩn. Nếu có một biến ẩn xảy ra không thay đổi trong mẫu đo được, thì mối tương quan sẽ không bao hàm nguyên nhân. Vạch ra tất cả các biến ẩn và bạn có quan hệ nhân quả.


Tôi có một số khó khăn để hiểu tại sao hướng mũi tên trong một mạng Bayes tương ứng có liên quan đến quan hệ nhân quả. Chẳng hạn, A-> B và B-> A đại diện cho các hướng khác nhau cho quan hệ nhân quả, nhưng các mạng Bayes cho hai cấu trúc đó là tương đương nhau
Yaroslav Bulatov

6
Chúng không tương đương khi đối mặt với các can thiệp.
Neil G

Các mạng Bayes này tương đương theo nghĩa được cung cấp dữ liệu được lấy mẫu từ một trong số chúng, bạn không thể biết đó là mạng nào
Yaroslav Bulatov

4
Er ... Tôi không quen thuộc với các số liệu thống kê thực bởi một cú sút xa ... nhưng không phải là "phơi bày tất cả các biến ẩn" theo định nghĩa là không thể? Làm thế nào để bạn biết khi không còn biến "ẩn"?
Craig Walker

4
@Craig Đó là điểm chính; Điều đó là không thể.
Justin L.

35

Tôi sẽ chỉ thêm một số ý kiến ​​bổ sung về quan hệ nhân quả khi nhìn từ góc độ dịch tễ học . Hầu hết các lập luận này được lấy từ Dịch tễ học tâm thần học thực tế , bởi Prince et al. (2003).

Nhân quả, hay giải thích nhân quả , cho đến nay là khía cạnh khó khăn nhất của nghiên cứu dịch tễ học. Các nghiên cứu đoàn hệcắt ngang có thể dẫn đến các hiệu ứng confoundig chẳng hạn. Trích dẫn S. Menard ( Nghiên cứu theo chiều dọc , Sage University Paper 76, 1991), HB Asher trong mô hình nhân quả (Sage, 1976) ban đầu đề xuất bộ tiêu chí sau đây phải được đáp ứng:

  • Các hiện tượng hoặc các biến trong câu hỏi phải đồng biến, như được chỉ ra bởi sự khác biệt giữa các nhóm thử nghiệm và nhóm kiểm soát hoặc bởi mối tương quan khác không giữa hai biến.
  • Mối quan hệ không được quy cho bất kỳ biến hoặc tập hợp biến nào khác, nghĩa là nó không được giả mạo, nhưng phải tồn tại ngay cả khi các biến khác được kiểm soát, như được chỉ ra bằng cách ngẫu nhiên thành công trong thiết kế thử nghiệm (không có sự khác biệt giữa thử nghiệm và nhóm kiểm soát trước khi điều trị) hoặc bằng một mối tương quan một phần khác không giữa hai biến với biến khác được giữ không đổi.
  • Nguyên nhân được cho là phải đi trước hoặc đồng thời với hiệu ứng được cho là kịp thời, như được chỉ ra bởi sự thay đổi trong nguyên nhân xảy ra không muộn hơn thay đổi liên quan đến hiệu ứng.

Mặc dù hai tiêu chí đầu tiên có thể dễ dàng được kiểm tra bằng nghiên cứu cắt ngang hoặc theo thứ tự thời gian, nhưng tiêu chí thứ hai chỉ có thể được đánh giá bằng dữ liệu theo chiều dọc, ngoại trừ các đặc điểm sinh học hoặc di truyền mà theo thứ tự thời gian có thể được giả sử mà không có dữ liệu theo chiều dọc. Tất nhiên, tình hình trở nên phức tạp hơn trong trường hợp mối quan hệ nhân quả không đệ quy.

Tôi cũng thích hình minh họa sau (Chương 13, trong tài liệu tham khảo đã nói ở trên) tóm tắt cách tiếp cận do Hill ban hành (năm 1965) bao gồm 9 tiêu chí khác nhau liên quan đến hiệu ứng nhân quả, cũng được trích dẫn bởi @James. Bài báo gốc thực sự có tựa đề "Môi trường và bệnh tật: sự liên kết hay nguyên nhân?" ( Phiên bản PDF ).

Đồi1965

Cuối cùng, Chương 2 của cuốn sách nổi tiếng nhất của Rothman, Dịch tễ học hiện đại (1998, Lippincott Williams & Wilkins, tái bản lần 2), đưa ra một cuộc thảo luận rất đầy đủ về quan hệ nhân quả và suy luận nguyên nhân, cả từ góc độ thống kê và triết học.

Tôi muốn thêm các tài liệu tham khảo sau (đại khái lấy từ một khóa học trực tuyến về dịch tễ học) cũng rất thú vị:

Cuối cùng, đánh giá này cung cấp một viễn cảnh lớn hơn về mô hình nguyên nhân, suy luận nguyên nhân trong thống kê: Tổng quan (J Pearl, SS 2009 (3)).


18

Trọng tâm của câu hỏi của bạn là câu hỏi "khi nào thì mối quan hệ là nguyên nhân?" Nó không chỉ cần là mối tương quan ngụ ý (hoặc không) quan hệ nhân quả.

Một cuốn sách hay về chủ đề này được gọi là Kinh tế lượng vô hại Johua Angrist và Jorn-Steffen Pischke . Họ bắt đầu từ lý tưởng thực nghiệm nơi chúng tôi có thể ngẫu nhiên hóa "phương pháp điều trị" đang được nghiên cứu trong một số thời trang và sau đó họ chuyển sang các phương pháp thay thế để tạo ra sự ngẫu nhiên này để tạo ra những ảnh hưởng nhân quả. Điều này bắt đầu với nghiên cứu về cái gọi là thí nghiệm tự nhiên.

Một trong những ví dụ đầu tiên về một thí nghiệm tự nhiên đang được sử dụng để xác định mối quan hệ nhân quả là bài viết năm 1989 của Angrist về "Thu nhập trọn đời và Xổ số dự thảo kỷ nguyên Việt Nam". Bài viết này cố gắng ước tính ảnh hưởng của nghĩa vụ quân sự đối với thu nhập trọn đời. Một vấn đề quan trọng với việc ước tính bất kỳ tác động nhân quả nào là một số loại người nhất định có thể dễ dàng tranh thủ hơn, điều này có thể làm sai lệch bất kỳ phép đo nào của mối quan hệ. Angrist sử dụng thí nghiệm tự nhiên do xổ số dự thảo Việt Nam tạo ra để "giao ngẫu nhiên" một cách hiệu quả "nghĩa vụ quân sự" cho một nhóm đàn ông.

Vậy khi nào chúng ta có nhân quả? Trong điều kiện thí nghiệm. Khi nào chúng ta gần nhau? Theo thí nghiệm tự nhiên. Ngoài ra còn có các kỹ thuật khác giúp chúng ta gần với "quan hệ nhân quả" tức là chúng tốt hơn nhiều so với việc sử dụng kiểm soát thống kê. Chúng bao gồm gián đoạn hồi quy, chênh lệch chênh lệch, v.v.


15

Cũng có một vấn đề với trường hợp ngược lại, khi thiếu mối tương quan được sử dụng như một bằng chứng cho việc thiếu nguyên nhân. Vấn đề này là phi tuyến tính; Khi nhìn vào mối tương quan, mọi người thường kiểm tra Pearson, đây chỉ là một phần nổi của tảng băng chìm.


14

Ví dụ của bạn là một thí nghiệm được kiểm soát . Bối cảnh duy nhất khác mà tôi biết về nơi một mối tương quan có thể ngụ ý nhân quả là một thí nghiệm tự nhiên .

Về cơ bản, một thí nghiệm tự nhiên tận dụng sự phân công của một số người trả lời cho một điều trị xảy ra tự nhiên trong thế giới thực. Vì việc chỉ định người trả lời cho các nhóm điều trị và kiểm soát không được kiểm soát bởi người thực nghiệm, mức độ tương quan sẽ ngụ ý quan hệ nhân quả có lẽ yếu hơn ở một mức độ nào đó.

Xem các liên kết wiki để biết thêm thông tin kiểm soát / thí nghiệm tự nhiên.


12

Theo tôi, lực lượng đặc nhiệm APA đã tóm tắt khá tốt

'' Suy ra quan hệ nhân quả từ các thiết kế phi thương mại là một doanh nghiệp rủi ro. Các nhà nghiên cứu sử dụng các thiết kế phi thương mại có nghĩa vụ bổ sung để giải thích logic đằng sau các đồng biến có trong thiết kế của họ và để cảnh báo người đọc về các giả thuyết đối thủ hợp lý có thể giải thích kết quả của họ. Ngay cả trong các thử nghiệm ngẫu nhiên, việc quy kết các tác động nhân quả vào bất kỳ một khía cạnh nào của tình trạng điều trị cần có sự hỗ trợ từ thử nghiệm bổ sung. '' - Lực lượng đặc nhiệm APA


11

Địa chỉ của Chủ tịch Sir Austin Bradford Hill cho Hiệp hội Y học Hoàng gia ( Môi trường và Bệnh tật: Hiệp hội hay Nguyên nhân? ) Giải thích chín tiêu chí giúp đánh giá liệu có mối quan hệ nhân quả giữa hai biến tương quan hoặc liên quan.

Họ đang:

  1. Sức mạnh của hiệp hội
  2. Tính nhất quán: "nó đã được quan sát nhiều lần bởi những người khác nhau, ở những nơi khác nhau, xơ gan và thời gian?"
  3. Tính đặc hiệu
  4. Tạm thời: "cái nào là xe ngựa và con ngựa nào?" - nguyên nhân phải đi trước hiệu lực
  5. Độ dốc sinh học (đường cong phản ứng liều) - theo cách nào thì độ lớn của hiệu ứng phụ thuộc vào độ lớn của biến nhân quả (nghi ngờ)?
  6. Tính hợp lý - có một lời giải thích có khả năng cho quan hệ nhân quả?
  7. Sự gắn kết - nhân quả sẽ mâu thuẫn với các sự kiện được thiết lập khác?
  8. Thử nghiệm - thao tác thử nghiệm biến nhân quả (nghi ngờ) có ảnh hưởng đến biến phụ thuộc (nghi ngờ) không
  9. Tương tự - chúng ta đã gặp phải mối quan hệ nhân quả tương tự trong quá khứ?

9

Trong ví dụ về cặp song sinh, nó không chỉ là mối tương quan gợi ý nhân quả, mà còn là thông tin liên quan hoặc kiến ​​thức trước đó.

Giả sử tôi thêm một phần thông tin. Giả sử rằng người sinh đôi siêng năng đã dành 6 giờ để nghiên cứu cho một bài kiểm tra thống kê, nhưng do một lỗi đáng tiếc, bài kiểm tra đã có trong lịch sử. Chúng ta vẫn sẽ kết luận nghiên cứu là nguyên nhân của hiệu suất vượt trội?

Xác định quan hệ nhân quả cũng là một câu hỏi triết học như một vấn đề khoa học, do đó xu hướng viện dẫn các nhà triết học như David Hume và Karl Popper khi quan hệ nhân quả được thảo luận.

Không có gì đáng ngạc nhiên khi y học đã có những đóng góp đáng kể trong việc thiết lập quan hệ nhân quả thông qua các phương pháp chẩn đoán, chẳng hạn như các định đề của Koch để thiết lập mối quan hệ nhân quả giữa vi khuẩn và bệnh tật. Những điều này đã được mở rộng thành "các định đề của phân tử Koch" cần thiết để chỉ ra rằng một gen trong mầm bệnh mã hóa một sản phẩm góp phần gây ra bệnh do mầm bệnh gây ra.

Thật không may, tôi không thể đăng một siêu liên kết được cho là CẨN THẬN Tôi là người dùng mới (không đúng sự thật) và không có đủ "điểm danh tiếng". Lý do thực sự là đoán của bất cứ ai.


9

Tương quan một mình không bao giờ ngụ ý nhân quả. Nó đơn giản mà.

Nhưng rất hiếm khi chỉ có mối tương quan giữa hai biến. Thường thì bạn cũng biết một vài điều về những biến đó là gì và một lý thuyết, hoặc lý thuyết, cho thấy tại sao có thể có mối quan hệ nhân quả giữa các biến. Nếu không, sau đó chúng tôi bận tâm kiểm tra một mối tương quan? (Tuy nhiên, người ta khai thác ma trận tương quan lớn để có kết quả quan trọng thường không có lý thuyết ngẫu nhiên - nếu không, tại sao lại phải khai thác. Một phản biện cho điều đó là thường cần một số thăm dò để có ý tưởng cho các lý thuyết thông thường. V.v. v.v.)

Đáp lại lời chỉ trích phổ biến "Vâng, nhưng đó chỉ là mối tương quan: nó không bao hàm nguyên nhân":

  1. Đối với một mối quan hệ thông thường, sự tương quan là cần thiết. Một thất bại lặp đi lặp lại để tìm một mối tương quan sẽ thực sự là tin xấu.
  2. Tôi không chỉ cho bạn một mối tương quan.
  3. Sau đó tiếp tục giải thích các cơ chế nhân quả có thể giải thích mối tương quan ...

2
Một ví dụ ngược với quan điểm số 1 của bạn: trong một hệ thống hỗn loạn, bạn có thể có quan hệ nhân quả không có mối tương quan rõ ràng.
mkt

8

Một điều kiện đủ hữu ích cho một số định nghĩa về quan hệ nhân quả:

Nguyên nhân có thể được xác nhận khi một trong các biến tương quan có thể được kiểm soát (chúng ta có thể trực tiếp đặt giá trị của nó) và mối tương quan vẫn còn.


2
Cũng có thể sử dụng từ của Pearl cho "trực tiếp thiết lập giá trị [một biến]": một sự can thiệp.
Neil G

8
  1. Hầu như luôn luôn trong các thử nghiệm ngẫu nhiên
  2. Hầu như luôn luôn trong nghiên cứu quan sát khi ai đó đo lường tất cả các mối quan hệ (hầu như không bao giờ)
  3. Thỉnh thoảng khi ai đó đo lường một số nhà phát minh (thuật toán IC * về khám phá DAG trong cuốn sách Nhân quả của Pearl)
  4. Trong các mô hình tuyến tính không gaussian có hai hoặc nhiều biến nhưng không sử dụng tương quan làm thước đo mối quan hệ ( LiNGAM )

Hầu hết các thuật toán khám phá được thực hiện trong Tetrad IV


6

Một câu hỏi liên quan có thể là - trong những điều kiện nào bạn có thể trích xuất một cách đáng tin cậy quan hệ nhân quả từ dữ liệu?

Một hội thảo NIPS 2008 cố gắng giải quyết câu hỏi đó theo kinh nghiệm. Một trong những nhiệm vụ là suy ra hướng nhân quả từ việc quan sát các cặp biến trong đó một biến được biết là gây ra biến khác và phương pháp tốt nhất có thể trích xuất chính xác hướng nhân quả 80% thời gian.


3

Hầu như chắc chắn trong một thí nghiệm được thiết kế tốt. (Tất nhiên, được thiết kế để gợi ra một mối quan hệ như vậy .)


3

Giả sử chúng ta nghĩ rằng yếu tố A là nguyên nhân của hiện tượng B. Sau đó, chúng ta cố gắng thay đổi nó để xem liệu B có thay đổi hay không. Nếu B không thay đổi và nếu chúng ta có thể cho rằng mọi thứ khác không thay đổi, bằng chứng mạnh mẽ cho thấy A không phải là nguyên nhân của B. Nếu B thay đổi, chúng ta không thể kết luận rằng A là nguyên nhân vì sự thay đổi của A có thể đã gây ra một sự thay đổi trong quan hệ nhân quả thực tế C, làm cho B thay đổi.


Bạn có thể làm cho A khác nhau?
RockScience

2

Tôi nhận thấy rằng "bằng chứng" đã được sử dụng ở đây khi thảo luận về mô hình thực nghiệm. Không có những điều như vậy. Đầu tiên là giả thuyết, trong đó ý tưởng được nâng cao; sau đó đến thử nghiệm, trong "điều kiện được kiểm soát" [lưu ý a] và nếu gặp phải sự thiếu bảo vệ "đủ" , nó sẽ tiến đến giai đoạn giả thuyết...giai đoạn = Stage. Không có bằng chứng, trừ khi người ta có thể 1) quản lý mọi lúc xảy ra sự kiện nói trên [ghi chú b] và tất nhiên 2) thiết lập quan hệ nhân quả. 1) là không thể có trong một vũ trụ vô tận [lưu ý vô hạn bởi bản chất không thể được chứng minh]. Lưu ý A; không có thí nghiệm nào được thực hiện trong các điều kiện hoàn toàn được kiểm soát và các điều kiện được kiểm soát càng nhiều thì càng ít giống với vũ trụ bên ngoài với các đường nhân quả rõ ràng là vô hạn. Lưu ý b; phiền bạn, bạn phải mô tả một cách hoàn hảo 'sự kiện', có lẽ có nghĩa là một ngôn ngữ hoàn toàn chính xác = có lẽ không phải là ngôn ngữ của con người. Đối với một lưu ý cuối cùng, tất cả các nhân quả có lẽ quay trở lại Sự kiện đầu tiên. Bây giờ hãy nói chuyện với mọi người với một lý thuyết. Vâng, tôi đã nghiên cứu chính thức và không chính thức. Cuối cùng; không, sự gần gũi không bao hàm mối quan hệ nhân quả hay thậm chí bất cứ điều gì khác ngoài sự tương quan tạm thời.


1

XY

Y= =bX+bạn

bXYE(b)= =BXbạnE(bạn|X)= =0bạn YXY

Không thiên vị là một đặc tính mong muốn của một người ước tính, nhưng bạn cũng muốn công cụ ước tính của mình hiệu quả (phương sai thấp) và nhất quán (có xu hướng xác suất thành giá trị thực). Xem các giả định của Gauss-Markov.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.