Làm thế nào để xác minh quan hệ nhân quả?


9

Sau khi chúng tôi đã chỉ ra rằng hai đại lượng tương quan với nhau, làm thế nào để chúng tôi suy luận rằng mối quan hệ là nguyên nhân? Và hơn nữa cái nào gây ra cái gì? Bây giờ trong lý thuyết, người ta có thể sử dụng một "phép gán ngẫu nhiên" (bất kể từ đúng là gì), để phá vỡ mọi liên kết tai nạn có thể tồn tại giữa hai biến. Nhưng trong một số trường hợp điều này là không thể làm được. Ví dụ, hãy xem xét mức độ thường xuyên của một người hút thuốc, được đo bằng thuốc lá mỗi tuần, so với tuổi thọ, được đo bằng năm. Chúng tôi có thể chọn ngẫu nhiên hai nhóm người. Làm cho một nhóm hút thuốc và nhóm kia không làm. Vì sự phân công là ngẫu nhiên nên điều này sẽ phá vỡ mọi mối quan hệ khác giữa chúng. Nhưng điều này là tất nhiên không thể làm vì nhiều lý do khác nhau. Vì vậy, một số kỹ thuật có thể được sử dụng là gì?


1
Thông qua các thí nghiệm được lên kế hoạch cẩn thận. ;-)
StatsStudent 18/215

@StatsStudent Thí nghiệm gì? Lấy ví dụ, thuốc lá vs tuổi thọ. Bạn có thực sự muốn thực hiện thí nghiệm đó, trong một số điều kiện kiểm soát, nếu bạn nghĩ rằng họ có tuổi thọ thấp hơn? Với các thí nghiệm rất dễ dàng để xác minh quan hệ nhân quả. Nhưng làm thế nào để làm điều đó từ một âm mưu tương quan?
Nicolas Bourbaki

@NicolasBourbaki câu hỏi của bạn bắt đầu bằng cách giả sử số lượng tương quan. Có phải điều này ngụ ý rằng chúng tôi cũng giả định rằng các biến có liên quan theo cách tuyến tính, chẳng hạn như Y = A * X + B?
cantorhead

@NicolasBourbaki Người ta có thể xác định và nhiều người sẽ nghĩ đến là "gây" . Mặt khác và không tương quan. X Y X ( t ) Y ( t + 1 )Y(t+1)= =cos(X(t))-1+noTôiSeXYX(t)Y(t+1)
cantorhead

@NicolasBourbaki Tôi đã cung cấp một câu trả lời giả sử tuyến tính dưới đây và muốn cung cấp một câu trả lời tổng quát hơn nhưng sẽ lạc đề nếu bạn chỉ quan tâm đến các mối quan hệ tuyến tính.
cantorhead

Câu trả lời:


5

Tôi nghĩ rằng đây là một câu hỏi rất hay. Tôi gặp vấn đề này thường xuyên và suy nghĩ về nó rất nhiều. Tôi làm nghiên cứu về khoa học y tế và quan niệm trong y học là không có gì được chứng minh là nguyên nhân, không bao giờ, không bao giờ, cho đến khi một thử nghiệm lâm sàng ngẫu nhiên có kiểm soát, tốt nhất là bằng một viên thuốc (hoặc bất kỳ phơi nhiễm nào khác có thể bị mù ba lần), đã được chứng minh một hiệu ứng trên các phản ứng quan tâm. Điều này khá buồn, vì tất cả các nghiên cứu khác được coi là nghiên cứu kết hợp, có xu hướng làm giảm tác động của chúng.

Hill và Richard Doll nghĩ về điều này. Các tiêu chí được xây dựng trước đây của Hill cho quan hệ nhân quả:

Các tiêu chí của Hill Hill, hay còn gọi là tiêu chí về nguyên nhân của Hill, là một nhóm các điều kiện tối thiểu cần thiết để cung cấp bằng chứng đầy đủ về mối quan hệ nhân quả giữa tỷ lệ mắc và hậu quả, được thành lập bởi nhà dịch tễ học người Anh Sir Austin Bradford Hill (1897 .1991) Năm 1965.


Sức mạnh : Một hiệp hội nhỏ không có nghĩa là không có tác động nhân quả, mặc dù hiệp hội càng lớn thì càng có nhiều khả năng đó là nhân quả. Tính nhất quán : Kết quả nhất quán được quan sát bởi những người khác nhau ở những nơi khác nhau với các mẫu khác nhau củng cố khả năng có hiệu lực. Tính đặc hiệu : Nguyên nhân có thể xảy ra nếu một dân số rất cụ thể tại một địa điểm cụ thể và bệnh mà không có lời giải thích nào khác. Mối liên hệ giữa một yếu tố và hiệu ứng càng cụ thể thì xác suất của mối quan hệ nhân quả càng lớn. Tạm thời : Hiệu ứng phải xảy ra sau nguyên nhân (và nếu có độ trễ dự kiến ​​giữa nguyên nhân và hiệu ứng mong đợi, thì hiệu ứng phải xảy ra sau độ trễ đó). Độ dốc sinh học : Tiếp xúc nhiều hơn thường dẫn đến tỷ lệ ảnh hưởng lớn hơn. Tuy nhiên, trong một số trường hợp, sự hiện diện đơn thuần của yếu tố có thể kích hoạt hiệu ứng. Trong các trường hợp khác, một tỷ lệ nghịch được quan sát: phơi nhiễm lớn hơn dẫn đến tỷ lệ mắc thấp hơn. Tính hợp lý: Một cơ chế hợp lý giữa nguyên nhân và kết quả là hữu ích (nhưng Hill lưu ý rằng kiến ​​thức về cơ chế này bị giới hạn bởi kiến ​​thức hiện tại). Sự kết hợp : Sự kết hợp giữa các kết quả dịch tễ học và xét nghiệm làm tăng khả năng có hiệu lực. Tuy nhiên, Hill lưu ý rằng "... thiếu bằng chứng [phòng thí nghiệm] như vậy không thể vô hiệu hóa hiệu quả dịch tễ học trên các hiệp hội". Thí nghiệm : "Thỉnh thoảng có thể kháng cáo bằng chứng thực nghiệm". Tương tự : Hiệu ứng của các yếu tố tương tự có thể được xem xét.


Điều này đã được hình thành khoảng 50 năm trước, trước khi có các thử nghiệm ngẫu nhiên (có thể không quan tâm đến lĩnh vực cụ thể của bạn) nhưng đáng chú ý là các thí nghiệm không có vai trò quan trọng trong tiêu chí Hill.

Tôi muốn nghĩ rằng dữ liệu quan sát, nếu được phân tích bằng các phương pháp thống kê phù hợp, sẽ cho phép suy luận về quan hệ nhân quả. (Tất nhiên điều này phụ thuộc vào nhiều yếu tố.) Nhưng trong lĩnh vực của tôi, khi nói đến việc thay đổi cách quản lý bệnh nhân, rất hiếm khi thấy các hướng dẫn được định hình bởi bất cứ điều gì khác ngoài các thử nghiệm ngẫu nhiên và khúc dạo đầu cho các hướng dẫn thường chỉ có thể là nguyên nhân nhất định thu được trong các thử nghiệm ngẫu nhiên.

Bây giờ tôi biết rằng nhiều bạn sẽ không đồng ý với tôi. Tôi cũng không đồng ý với chính mình. Nhưng nó có thể thêm vào một cuộc thảo luận.


"(có thể không quan tâm đến lĩnh vực cụ thể của bạn)" Sở thích của tôi là hình học đại số và số học. Đó là xa như loại bỏ khỏi số liệu thống kê như người ta có thể tưởng tượng. Tôi chỉ hỏi nó như một sự tò mò.
Nicolas Bourbaki

2

Thống kê cung cấp các công cụ để phát hiện và mô hình hóa tính thường xuyên trong dữ liệu. Quá trình mô hình hóa thường được hướng dẫn bởi kiến ​​thức chủ đề. Khi mô hình đại diện cho cơ chế đối tượng, các thuộc tính thống kê của mô hình ước tính cho biết liệu dữ liệu có mâu thuẫn với cơ chế được mô hình hóa hay không. Sau đó, tính nhân quả (hoặc thiếu nó) được suy ra - và điều này được thực hiện trên miền chủ đề .

xy

xy






0

Câu hỏi hiện tại giả định rằng các đại lượng có tương quan, ngụ ý rằng người xác định mối tương quan phải có lý do chính đáng để tin rằng các biến có chung mối quan hệ tuyến tính.

Granger Causality có thể là công cụ tốt nhất để xác định mối quan hệ nhân quả tuyến tính. Granger là một nhà kinh tế, người đã chia sẻ một giải thưởng cao quý cho công trình của mình về Nhân quả tuyến tính.

{Xt(Tôi)}Tôi= =1kYt

  1. Nguyên nhân nên xảy ra trước khi có hiệu lực.
  2. Nguyên nhân nên chứa thông tin về hiệu ứng không có sẵn khác.

X= =[Xt-1(1),Xt-2(1),Giáo dục,Xt-m(1),Xt-1(2),Xt-2(2),Giáo dục,Xt-m(2),Giáo dục,Xt-m(k)]TY= =[Yt-1,Yt-2,Giáo dục,Yt-m]Tmmm

Yt= =MộtY+εtYt= =Một'[Y,X]T+εt'.
Xt-Tôi(j)Ytεtεt'

Zt(1),Giáo dục,Zt(p)Z= =[Zt-1(1),Zt-2(1),Giáo dục,Zt-m(p)]T

Yt= =Một[Y,Z]T+εtYt= =Một'[Y,X,Z]T+εt'.

Đây chỉ là một bản phác thảo thô và tôi tin rằng nhiều tác giả đã cải thiện ý tưởng này.


Chào mừng đến với trang web, @cantorhead. Chúng tôi muốn (câu hỏi và) câu trả lời ở đây được khép kín. Sẽ tốt hơn nếu bạn cố gắng "cụ thể hơn ở đây" & không chỉ đề xuất với mọi người về Google.
gung - Tái lập Monica

0

Bạn không thể - ít nhất là không nằm trong số liệu thống kê.

Maxim: bạn không bao giờ có thể biết chắc chắn rằng ảnh hưởng của một biến là do biến khác gây ra. Lý do: bạn không bao giờ có thể biết nếu không có biến nào khác mà bạn không biết và dữ liệu bạn đã thu thập không thể cho bạn biết.

Thực tế của cuộc sống là việc thu thập dữ liệu không phải lúc nào cũng đủ khi dữ liệu tĩnh và hiện tượng là động - giống như hành vi của con người. Có thu thập dữ liệu chính nó có thể làm sai lệch kết quả, giống như cách trong vật lý hạt thực tế quan sát bản thân không thể được gỡ bỏ từ phương trình.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.