Sự không tin tưởng vào mô hình nhân quả của Rubin - lời giải thích của Layman


12

Khi thực hiện mô hình nhân quả của Rubin, một trong những giả định (không thể kiểm chứng) mà chúng ta cần là sự không tin tưởng, có nghĩa là

(Y(0),Y(1))T|X

Trong đó LHS là các tác dụng phụ, T là phương pháp điều trị và X là các đồng biến mà chúng ta kiểm soát.

Tôi đang tự hỏi làm thế nào để mô tả điều này với một người không biết nhiều về Mô hình nhân quả Rubin. Tôi hiểu tại sao về mặt lý thuyết chúng ta cần giả định này, nhưng tôi không chắc về khái niệm tại sao điều này lại quan trọng. Cụ thể, nếu T là điều trị, không nên kết quả tiềm năng phụ thuộc rất nhiều vào nó? Cũng như vậy, nếu chúng ta có một thử nghiệm ngẫu nhiên, sau đó tự động, . Tại sao điều này đúng?(Y(0),Y(1))T

Làm thế nào bạn sẽ mô tả giả định vô căn cứ / thiếu hiểu biết cho một người chưa nghiên cứu RCM?


Đối với điểm phù hợp với xu hướng, trước tiên, dễ dàng chứng minh rằng phân phối có điều kiện của trùng với phân phối có điều kiện của . Do đó, sự không tin tưởng / thiếu hiểu biết ngụ ý rằng . Đối với các thử nghiệm ngẫu nhiên, phải độc lập với bất kỳ biến nào khác tham gia vào các thử nghiệm. X | T = 0 , p ( X ) = q ( Y ( 0 ) , Y ( 1 ) ) T | p ( X ) TX | T=1,p(X)=qX | T=0,p(X)=q(Y(0),Y(1))  T | p(X)T
Viktor

Câu trả lời:


11

Làm thế nào bạn sẽ mô tả giả định vô căn cứ / thiếu hiểu biết cho một người chưa nghiên cứu RCM?

Về trực giác với ai đó không thành thạo suy luận nguyên nhân, tôi nghĩ đây là nơi bạn có thể sử dụng biểu đồ. Họ trực quan theo nghĩa là họ thể hiện "dòng chảy" một cách trực quan và họ cũng sẽ làm rõ ý nghĩa thực sự của sự thiếu hiểu biết trong thế giới thực.

Sự thiếu hiểu biết có điều kiện tương đương với yêu cầu thỏa mãn tiêu chí cửa sau. Vì vậy, theo thuật ngữ trực quan, bạn có thể nói với người đó rằng các đồng biến bạn đã chọn cho "chặn" tác động của các nguyên nhân phổ biến của và (và không mở bất kỳ liên kết giả nào khác).XXTY

Nếu các biến gây nhiễu duy nhất có thể hiểu được của vấn đề của bạn là các biến trên chính , thì đây là chuyện nhỏ để giải thích. Bạn chỉ cần nói rằng vì contais tất cả các nguyên nhân phổ biến của cả và , đó là tất cả những gì bạn cần kiểm soát. Vì vậy, bạn có thể nói với cô ấy đó là cách bạn nhìn thế giới:XXTY

nhập mô tả hình ảnh ở đây

Trường hợp thú vị hơn là khi có thể có những kẻ gây nhiễu đáng tin cậy khác ngoài kia. Cho cụ thể hơn, bạn thậm chí có thể yêu người đó đến tên một confounder tiềm năng của vấn đề của bạn - có nghĩa là, hỏi cô ấy để đặt tên cho một cái gì đó khiến cả và , nhưng nó không có trong .TYX

Nói tên người một biến . Sau đó, bạn có thể nói với người đó rằng những gì ignorability giả định điều kiện của bạn một cách hiệu quả có nghĩa là bạn nghĩ rằng sẽ "khối" ảnh hưởng của trên và / hoặc . ZXZTY

Và bạn nên cho cô ấy một lý do thực sự tại sao bạn nghĩ đó là sự thật. Có nhiều biểu đồ có thể biểu thị điều đó, nhưng nói rằng bạn đưa ra lời giải thích này: " sẽ không làm sai lệch kết quả vì mặc dù gây ra và , nhưng ảnh hưởng của nó đối với chỉ thông qua , mà chúng ta đang kiểm soát". ZZTYTXVà sau đó hiển thị biểu đồ này:

nhập mô tả hình ảnh ở đây

Và bạn có thể nghĩ về những người đồng sáng lập khác và cho cô ấy thấy đang chặn chúng một cách trực quan trên biểu đồ.X

Bây giờ trả lời các câu hỏi khái niệm:

Cụ thể, nếu T là điều trị, không nên kết quả tiềm năng phụ thuộc rất nhiều vào nó? Đồng thời, nếu chúng tôi có một thử nghiệm ngẫu nhiên có kiểm soát, thì tự động ,. Tại sao điều này đúng?

Không. Hãy nghĩ về như sự phân công điều trị. Những gì nó nói là bạn đang chỉ định điều trị cho những người "phớt lờ" cách họ đáp ứng với điều trị (kết quả tiềm năng phản tác dụng). Một vi phạm đơn giản về điều này sẽ là bạn có xu hướng đưa ra cách đối xử với những người có khả năng hưởng lợi nhiều nhất từ ​​nó.T

Đó cũng là lý do tại sao điều này tự động giữ khi bạn chọn ngẫu nhiên. Nếu bạn chọn điều trị ngẫu nhiên, điều này có nghĩa là bạn đã không kiểm tra phản ứng tiềm năng của họ đối với việc điều trị để chọn họ.


Để bổ sung cho câu trả lời, đáng chú ý rằng việc hiểu sự thiếu hiểu biết mà không nói về quá trình nguyên nhân, nghĩa là, không cần gọi các phương trình cấu trúc / mô hình đồ họa thực sự khó khăn. Hầu hết thời gian bạn thấy các nhà nghiên cứu lôi cuốn ý tưởng về "việc điều trị là ngẫu nhiên" nhưng không giải thích được tại sao đó là lý do tại sao điều đó hợp lý khi sử dụng các cơ chế và quy trình trong thế giới thực.

Trên thực tế, nhiều nhà nghiên cứu chỉ đơn giản cho rằng sự thiếu hiểu biết để thuận tiện, nhằm biện minh cho việc sử dụng các phương pháp thống kê. Đoạn văn này từ bài báo của Joffe, Yang và Feldman nói lên một sự thật bất tiện mà hầu hết mọi người đều biết nhưng không nói trong các bài thuyết trình hội thảo: "Các giả định không biết gì thường được đưa ra bởi vì họ biện minh cho việc sử dụng các phương pháp thống kê có sẵn, và không phải vì nó thực sự được tin tưởng."

Nhưng, như tôi đã nói ở phần đầu của câu trả lời, bạn có thể sử dụng các biểu đồ để tranh luận về việc liệu chỉ định điều trị có bị bỏ qua hay không. Mặc dù khái niệm về sự thiếu hiểu biết rất khó nắm bắt, bởi vì nó đưa ra các phán đoán về đại lượng chính xác, trong các biểu đồ về cơ bản bạn đang đưa ra các tuyên bố định tính về các quá trình nguyên nhân (biến này gây ra biến đó, v.v.), rất dễ giải thích và hấp dẫn trực quan.

Như đã đề cập trong câu trả lời trước, có một sự tương đương chính thức giữa các biểu đồ và kết quả tiềm năng . Do đó, bạn cũng có thể đọc kết quả tiềm năng từ biểu đồ. Làm cho kết nối này trở nên chính thức hơn (để biết thêm về Nhân quả của Pearl, tr.343), bạn có thể sử dụng định nghĩa sau: các kết quả tiềm năng sẽ đại diện cho tổng số tất cả các biến (quan sát và thuật ngữ lỗi) ảnh hưởng đến Y khi T không đổi .

Sau đó, thật dễ dàng để biết lý do tại sao sự thiếu hiểu biết giữ trong RCT, nhưng quan trọng hơn, nó cũng cho phép bạn dễ dàng phát hiện ra các tình huống mà sự thiếu hiểu biết sẽ không giữ được. Ví dụ: trong biểu đồ , T là không thể biết được, nhưng T không thể bỏ qua điều kiện X, bởi vì một khi bạn có điều kiện trên X, bạn mở một đường dẫn va chạm từ thuật ngữ lỗi của X đến T.TXY

Tóm lại, nhiều nhà nghiên cứu đưa ra giả định không biết gì theo mặc định, để thuận tiện. Đó là một cách thuận tiện để giả định sự đầy đủ của một bộ điều khiển mà không cần phải chính thức biện minh tại sao lại như vậy, nhưng để giải thích ý nghĩa của nó trong bối cảnh thực sự đối với một giáo dân, bạn sẽ cần phải đưa ra một câu chuyện nhân quả, đó là giả định nguyên nhân và bạn có thể chính thức kể câu chuyện đó với sự trợ giúp của đồ thị nhân quả.


8

Tôi nghĩ rằng bạn đang bị treo lên về sự khác biệt giữa các kết quả tiềm năng và kết quả quan sát được . Điều thứ hai chịu ảnh hưởng rất nhiều từ việc điều trị, nhưng chúng tôi hy vọng cặp đôi này thì không.(Y0,Y1)Y

Đây là trực giác (đặt điều kiện sang một bên cho đơn giản) về kết quả quan sát được. Đối với mỗi quan sát, kết quả nhận ra có thể được biểu thị bằngX

Y=TY1+(1T)Y0.

Điều này có nghĩa là và phụ thuộc vì giá trị trung bình của sẽ không bằng trung bình (miễn là hiệu quả điều trị là khác không và điều trị là ngẫu nhiên / không thể biết được) .YTTY1(1T)Y0

Đây là trực giác cho phần thứ hai. Nếu chúng ta sẽ tìm hiểu về tác động nhân quả của , chúng tôi sẽ so sánh điều trị và quan sát không được điều trị, trong khi sự khác biệt trong vào tài khoản. Chúng tôi giả định rằng nhóm đối chứng là phản tác dụng đối với nhóm điều trị nếu họ không được điều trị. Nhưng nếu mọi người chọn cách điều trị riêng dựa trên kết quả tiềm năng của họ (hoặc kỳ vọng về kết quả tiềm năng), thì sự so sánh này là táo với đười ươi. Đây giống như một thử nghiệm y tế trong đó chỉ những bệnh nhân khỏe mạnh hơn mới lựa chọn phẫu thuật đau đớn bởi vì nó đáng giá cho họ. So sánh của chúng tôi sẽ bị ô nhiễm nếu lựa chọn lựa chọn điều trị không phải là ngẫu nhiên sau khi điều hòa trênTXX(các biến đo lường tình trạng sức khỏe hiện tại cần theo dõi với bác sĩ và bệnh nhân). Một ví dụ về một biến số không thể quan sát được có thể là người phối ngẫu yêu bạn rất nhiều, vì vậy cô ấy khuyên bạn nên phẫu thuật, nhưng cũng đảm bảo rằng bạn tuân thủ hướng dẫn của bác sĩ sau phẫu thuật, từ đó cải thiện kết quả . Hiệu quả đo được bây giờ là sự kết hợp giữa phẫu thuật và giúp đỡ yêu thương, đó không phải là điều chúng tôi muốn đo lường. Một ví dụ tốt hơn là bị ảnh hưởng bởi việc điều trị, hoặc là bài cũ hoặc ante trước khi điều trị.Y1X


Nhìn vào phần mà bạn nói "Tôi nghĩ rằng bạn đang cảm thấy khó chịu về sự khác biệt giữa các kết quả tiềm năng (Y0, Y1) và kết quả quan sát được Y. Điều sau bị ảnh hưởng rất nhiều bởi điều trị, nhưng chúng tôi hy vọng cặp đôi trước đây không bị ảnh hưởng. " Điều này có thể được hiểu là "Kết quả quan sát được tùy thuộc vào điều trị, nhưng theo giả thuyết không có hiệu quả điều trị, việc điều trị sẽ không ảnh hưởng đến kết quả tiềm năng"? Tại sao chúng tôi hy vọng rằng các kết quả tiềm năng bị ảnh hưởng bởi các phương pháp điều trị
RayVelcoro

1
@RayVelcoro Không, đó không phải là cách tôi sẽ đặt nó. Tôi sẽ nói rằng việc biết liệu ai đó được chỉ định (hoặc chọn) điều trị không chứa thông tin về kết quả của anh ta nếu cả hai được điều trị và không được điều trị, có điều kiện trên X của anh ta và không có thông tin về bất kỳ tác động nhân quả nào được xác định từ họ, như . Điều này không có gì để làm với null của hiệu ứng không. Y1Y0
Dimitriy V. Masterov

Tôi có thể hỏi tại sao thực tế trung bình của không bằng trung bình của ngụ ý rằng và phụ thuộc không? cảm ơn ( 1 - T ) Y 0 Y TTY1(1T)Y0YT
user321627

@ user321627 Nếu bạn tính toán sự khác biệt trong kết quả quan sát có nghĩa là điều trị và kiểm soát, điều đó là hiển nhiên.
Dimitriy V. Masterov
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.