Tại sao điểm số phù hợp làm việc cho suy luận nguyên nhân?


13

Kết hợp điểm số được sử dụng để đưa ra các kết luận nguyên nhân trong các nghiên cứu quan sát (xem bài viết của Rosenbaum / Rubin ). Trực giác đơn giản đằng sau tại sao nó hoạt động?

Nói cách khác, tại sao nếu chúng ta đảm bảo xác suất tham gia điều trị là bằng nhau cho hai nhóm, các tác động gây nhiễu sẽ biến mất và chúng ta có thể sử dụng kết quả để đưa ra kết luận nguyên nhân về việc điều trị?


8
Của tôi có lẽ là một ý kiến ​​không phổ biến, nhưng tôi nghĩ rằng việc nói rằng PSM cho phép bạn đưa ra những suy luận nhân quả đang kéo dài nó một chút. Đúng, đó là một phương thức khớp tốt hơn so với chỉ khớp "thô" trên một số biến, nhưng vào cuối ngày, bạn vẫn chỉ khớp với những biến có thể quan sát được với bạn. Bạn vẫn có thể điều trị nội sinh, nhưng bạn đưa ra giả định rằng sau khi kết hợp, điều trị là ngoại sinh. Nhưng một lần nữa, tôi không là ai so với những người như Rubin :)
Hầu tước de Carabas

5
Có những người không đồng ý với Rosenbaum và Rubin. Gary King đã lập luận khá hiệu quả rằng các kết quả từ kết hợp sử dụng PSM kém hơn so với kết quả thu được từ kết hợp dựa trên khoảng cách Mahalanobis. Xem giấy của mình ở đây ... gking.harvard.edu/files/gking/files/psnot.pdf?m=1456683191 Bên cạnh đó, hội thảo trên web này cung cấp thậm chí hấp dẫn hơn bằng chứng ... methods-colloquium.com/...
Mike Hunter

4
Về lý thuyết, bạn CÓ THỂ đưa ra suy luận nhân quả khi áp dụng mô hình nhân quả của Rubin nếu tất cả các giả định đều được đáp ứng. Nhưng tất nhiên ma quỷ luôn nằm trong các chi tiết của giả định, và đối với tôi, giả định về những kẻ gây nhiễu không quan sát được thường là một điều khó khăn. Trên thực tế, không thể chứng minh. Nhưng ít nhất bạn có thể thực hiện các phân tích độ nhạy để xác định những gì sẽ cần cho kết luận của bạn sẽ thay đổi nếu bạn có các yếu tố gây nhiễu không quan sát được.
StatsStudent

5
Điểm tốt @DJohnson. Ngoài ra còn có những người như Judea Pearl, Ian Shrier và Arvid Sjolander đang chỉ trích Khung kết quả tiềm năng của Rubin về suy luận nguyên nhân do khả năng đưa ra "M-bias" thông qua cái mà họ gọi là "máy va chạm". Chúng là những bài đọc thú vị và nên bổ sung bất kỳ bài đọc nào từ Rubin.
StatsStudent

Câu trả lời:


12

Tôi sẽ cố gắng cung cấp cho bạn một sự hiểu biết trực quan với sự nhấn mạnh tối thiểu vào toán học.

Vấn đề chính với dữ liệu quan sát và phân tích xuất phát từ nó là khó hiểu. Sự bối rối xảy ra khi một biến số không chỉ ảnh hưởng đến việc điều trị được chỉ định mà còn cả kết quả. Khi một thí nghiệm ngẫu nhiên được thực hiện, các đối tượng được chọn ngẫu nhiên để điều trị sao cho trung bình, các đối tượng được chỉ định cho mỗi điều trị phải tương tự với các đồng biến (tuổi, chủng tộc, giới tính, v.v.). Do kết quả ngẫu nhiên này, không có khả năng (đặc biệt là trong các mẫu lớn) rằng sự khác biệt về kết quả là do bất kỳ đồng biến nào, nhưng do điều trị được áp dụng, vì, trung bình, các hiệp phương sai trong các nhóm điều trị là tương tự nhau.

Mặt khác, với dữ liệu quan sát, không có cơ chế ngẫu nhiên nào chỉ định đối tượng điều trị. Lấy ví dụ một nghiên cứu để kiểm tra tỷ lệ sống sót của bệnh nhân sau phẫu thuật tim mới so với quy trình phẫu thuật tiêu chuẩn. Thông thường, người ta không thể chọn ngẫu nhiên bệnh nhân cho mỗi thủ tục vì lý do đạo đức. Kết quả là bệnh nhân và bác sĩ tự chọn vào một trong các phương pháp điều trị, thường là do một số lý do liên quan đến đồng biến của họ. Ví dụ, quy trình mới có thể nguy hiểm hơn nếu bạn lớn tuổi và do đó, các bác sĩ có thể đề nghị phương pháp điều trị mới thường xuyên hơn cho bệnh nhân trẻ tuổi. Nếu điều này xảy ra và bạn nhìn vào tỷ lệ sống sót, phương pháp điều trị mới có vẻ hiệu quả hơn, nhưng điều này sẽ gây hiểu lầm vì bệnh nhân trẻ tuổi được chỉ định điều trị này và bệnh nhân trẻ tuổi có xu hướng sống lâu hơn, tất cả những thứ khác đều bình đẳng Đây là nơi điểm số xu hướng có ích.

Điểm số tuyên truyền giúp giải quyết vấn đề cơ bản của suy luận nguyên nhân - rằng bạn có thể bị nhiễu do không ngẫu nhiên đối tượng điều trị và đây có thể là nguyên nhân của "tác động" mà bạn đang thấy thay vì chỉ can thiệp hoặc điều trị. Nếu bạn có thể sửa đổi phân tích của mình bằng cách nào đó để các đồng biến (nói tuổi, giới tính, giới tính, tình trạng sức khỏe) được cân bằng giữa các nhóm điều trị, bạn sẽ có bằng chứng mạnh mẽ rằng sự khác biệt về kết quả là do can thiệp / điều trị thay vì các đồng biến này. Điểm số về tỷ lệ, xác định xác suất của từng đối tượng được chỉ định cho điều trị mà họ nhận được với tập hợp các covarites quan sát được. Nếu sau đó bạn phù hợp với các xác suất này (điểm số xu hướng),

Bạn có thể hỏi tại sao không khớp chính xác trên các đồng biến (ví dụ: đảm bảo bạn phù hợp với nam giới 40 tuổi có sức khỏe tốt trong điều trị 1 với nam 40 tuổi có sức khỏe tốt trong điều trị 2)? Điều này hoạt động tốt đối với các mẫu lớn và một số đồng biến, nhưng gần như không thể thực hiện được khi kích thước mẫu nhỏ và số lượng đồng biến thậm chí có kích thước vừa phải (xem lời nguyền về tính chiều trên Xác thực chéo vì sao đây là trường hợp) .

Bây giờ, tất cả điều này đang được nói, gót chân Achilles của điểm số xu hướng là giả định không có yếu tố gây nhiễu không quan sát được. Giả định này nói rằng bạn đã không bao gồm bất kỳ hiệp phương sai nào trong điều chỉnh của bạn là các yếu tố gây nhiễu tiềm năng. Theo trực giác, lý do đằng sau điều này là nếu bạn chưa bao gồm một kẻ gây nhiễu khi tạo điểm số xu hướng của mình, làm thế nào bạn có thể điều chỉnh cho nó? Ngoài ra còn có các giả định bổ sung như giả định giá trị điều trị đơn vị ổn định, trong đó nêu rõ rằng việc điều trị được chỉ định cho một đối tượng không ảnh hưởng đến kết quả tiềm năng của các đối tượng khác.


7

Theo một nghĩa nghiêm ngặt, việc điều chỉnh điểm xu hướng không liên quan nhiều đến suy luận nguyên nhân so với mô hình hồi quy. Sự khác biệt thực sự duy nhất với điểm số xu hướng là chúng giúp điều chỉnh dễ dàng hơn cho các yếu tố gây nhiễu tiềm năng quan sát hơn so với kích thước mẫu có thể cho phép các mô hình hồi quy kết hợp. Điều chỉnh điểm số (được thực hiện tốt nhất thông qua điều chỉnh đồng biến trong phần lớn các trường hợp, sử dụng spline trong logit PS) có thể được coi là một kỹ thuật giảm dữ liệu trong đó việc giảm dọc theo một trục quan trọng - gây nhiễu. Tuy nhiên, nó không xử lý sự không đồng nhất về kết quả (độ nhạy cảm), do đó bạn cũng phải điều chỉnh các đồng biến quan trọng ngay cả khi sử dụng xu hướng (xem thêm các vấn đề liên quan đến tỷ lệ không sụp đổ của tỷ lệ cược và tỷ lệ rủi ro).

Kết hợp điểm số có thể loại trừ nhiều quan sát và do đó không hiệu quả khủng khiếp. Tôi xem bất kỳ phương pháp nào loại trừ các quan sát liên quan là có vấn đề. Vấn đề thực sự với kết hợp là nó loại trừ các quan sát phù hợp dễ dàng do một số nhu cầu nhận thức về việc có khớp 1: 1 và hầu hết các thuật toán khớp đều phụ thuộc vào thứ tự quan sát.

Lưu ý rằng rất dễ dàng khi thực hiện điều chỉnh hồi quy tiêu chuẩn để gây nhiễu để kiểm tra và loại trừ các vùng không chồng lấp. Người dùng điểm số tỷ lệ được dạy để làm điều này và lý do duy nhất mà người lập mô hình hồi quy không làm là họ không được dạy.

Phân tích điểm số tỷ lệ che giấu bất kỳ tương tác nào với phơi nhiễm và kết hợp điểm số phù hợp ẩn ngoài mối quan hệ có thể có giữa PS và hiệu quả điều trị.

Phân tích độ nhạy (đối với các yếu tố gây nhiễu không được đo lường) đã được thực hiện cho PS nhưng thậm chí còn dễ thực hiện hơn với mô hình hồi quy tiêu chuẩn.

Nếu bạn sử dụng các phương pháp hồi quy linh hoạt để ước tính PS (ví dụ: không giả sử bất kỳ biến liên tục nào hoạt động tuyến tính), bạn thậm chí không cần kiểm tra sự cân bằng - phải có sự cân bằng hoặc mô hình hồi quy PS không được chỉ định chính xác ngay từ đầu . Bạn chỉ cần kiểm tra không trùng lặp. Giả định này không có tương tác quan trọng nào được bỏ qua từ mô hình xu hướng. Kết hợp làm cho cùng một giả định.


3

Tôi khuyên bạn nên kiểm tra Hầu hết Kinh tế lượng vô hại - họ có một lời giải thích tốt về điều này ở mức độ trực quan.

Vấn đề bạn đang cố gắng giải quyết là sự lựa chọn sai lệch. Nếu một biến tương quan với các kết quả tiềm năng và với khả năng được điều trị, thì nếu bạn thấy rằng kết quả mong đợi của điều trị tốt hơn kết quả mong đợi của điều trị không được điều trị, điều này có thể là một phát hiện giả vì xu hướng được xử lý có cao hơn và do đó có . Vấn đề phát sinh vì làm cho tương quan với việc điều trị.xiy0i,y1ixy0i,y1ixy0i,y1i

Vấn đề này có thể được giải quyết bằng cách kiểm soát . Nếu chúng tôi nghĩ rằng mối quan hệ giữa các kết quả tiềm năng và các biến là tuyến tính, chúng tôi chỉ thực hiện điều này bằng cách đưa vào hồi quy với biến giả để điều trị và biến giả tương tác với . Tất nhiên, hồi quy tuyến tính là linh hoạt vì chúng ta cũng có thể bao gồm các hàm của . Nhưng nếu chúng ta không muốn áp đặt một hình thức chức năng thì sao? Sau đó, chúng ta cần sử dụng một cách tiếp cận không tham số: khớp.xxxxx

Với kết hợp, chúng tôi so sánh các quan sát được điều trị và không được điều trị với tương tự . Chúng tôi đi từ điều này với ước tính về hiệu quả điều trị cho tất cả các giá trị (hoặc phạm vi giá trị nhỏ hoặc "xô") mà chúng tôi đã quan sát cả điều trị và không được điều trị. Nếu chúng ta không có nhiều giá trị hoặc xô như vậy , đặc biệt nếu là một vectơ có chiều cao nên khó tìm thấy các quan sát gần nhau, thì rất hữu ích khi chiếu không gian này lên một chiều.xxxx

Đây là những gì phù hợp với điểm số xu hướng làm. Nếu là không tương quan với điều trị cho , sau đó nó quay ra rằng họ cũng đang không tương quan với điều trị cho nơi là xác suất điều trị cho , tức là số điểm xu hướng của .y0i,y1ixip(xi)p(x)xx

Đây là trực giác của bạn: nếu chúng tôi tìm thấy một mẫu quan sát phụ có điểm số xu hướng rất giống , thì đối với mẫu phụ đó, các nhóm được xử lý và không được xử lý sẽ không tương thích vớip(x)xxxy0i,y1ikhông quan tâm đến việc điều trị Điều kiện này đảm bảo rằng sự khác biệt trung bình của mẫu phụ về kết quả giữa được điều trị và không được điều trị là một ước tính phù hợp về hiệu quả điều trị trung bình trên mẫu phụ này, tức là

E[yi|Treated,p(x)]E[yi|Untreated,p(x)]

là một ước tính phù hợp của hiệu quả điều trị trung bình tại địa phương.

Đọc thêm:

Chúng ta có nên thực sự sử dụng kết hợp điểm xu hướng trong thực tế?

Câu hỏi liên quan so sánh kết hợp và hồi quy


1

Nó "hoạt động" với cùng lý do là hồi quy "hoạt động" - bạn đang kiểm soát tất cả các yếu tố gây nhiễu.

Bạn có thể thực hiện điều khiển phân tích như vậy bằng mô hình hồi quy được chỉ định đầy đủ với nhiều biến có thể gây nhiễu hoặc mô hình hồi quy chỉ có một biến - điểm số khuynh hướng (có thể hoặc không phải là mô hình phức tạp như nhau bao gồm các yếu tố gây nhiễu tương tự). Bạn có thể gắn bó với hồi quy này với điểm số của xu hướng hoặc bạn có thể so sánh phản hồi trong các nhóm tương tự, trong đó độ tương tự được xác định bởi điểm số của xu hướng. Về tinh thần, bạn đang làm điều tương tự, nhưng một số người cảm thấy rằng phương pháp sau tốt hơn làm nổi bật nhiệm vụ nhân quả trong tay.

Cập nhật phản hồi sau

Y(0),Y(1)T|XY(0),Y(1)T|p(X),
và đọc về một phiên bản của kết hợp lân cận gần nhất, được gọi là "kết hợp caliper" (tr. 108) trong đó điểm số của xu hướng điều trị và trường hợp kiểm soát gần nhất phải nằm trong khoảng cách tối đa, dẫn đến một số trường hợp điều trị không khớp. Trong trường hợp này, phương pháp vẫn sẽ hoạt động bằng cách điều chỉnh điểm số của xu hướng bằng cách sử dụng một phép tương tự không tham số để hồi quy, nhưng nó cũng làm rõ những gì không thể biết được từ dữ liệu (không có mô hình để ngoại suy) và cho phép xác định lại số lượng nhân quả cho các dữ liệu có sẵn.

1
Câu trả lời này được định sẵn là không thích vì nó làm giảm bớt các phương pháp cho điểm số bằng cách so sánh chúng với hồi quy, một từ bẩn thỉu trong vòng tròn nhân quả. Nhưng câu trả lời hàng đầu thừa nhận rằng "gót chân Achilles của điểm số xu hướng là giả định không có yếu tố gây nhiễu không quan sát được." Đó là một gót chân Achilles khá lớn. Giả sử đã được đáp ứng và tôi đã có một bộ dữ liệu với tất cả các yếu tố gây nhiễu trong vũ trụ. Giúp tôi hiểu lý do tại sao hồi quy sẽ không hoạt động để khám phá sự thật nguyên nhân nhưng ý chí phù hợp với điểm số.
Ben Ogorek

1
Lý do tại sao hồi quy thường có vấn đề là vì kết quả từ hồi quy được ngoại suy. Với điểm số của xu hướng, người ta đảm bảo, trong quá trình kiểm tra cân bằng đồng biến rằng có đủ sự chồng chéo gây nhiễu giữa các nhóm điều trị. Đây không nhất thiết là trường hợp trong hồi quy & có thể dẫn đến các ước tính không chính xác vì không có kiểm tra chẩn đoán chuẩn nào sẽ cho bạn biết mô hình hồi quy của bạn đang ngoại suy. Đó là lý do tại sao tôi thường chạy kiểm tra cân bằng điểm xu hướng ngay cả khi tôi chỉ chạy mô hình hồi quy và không có kế hoạch sử dụng điểm số xu hướng.
StatsStudent
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.