Làm thế nào nhiều hồi quy có thể thực sự kiểm soát được đối với các đồng biến số?


45

Chúng ta đều quen thuộc với các nghiên cứu quan sát cố gắng thiết lập mối liên hệ nhân quả giữa một yếu tố dự đoán X không thương mại hóa và kết quả bằng cách bao gồm mọi yếu tố gây nhiễu tiềm năng có thể tưởng tượng trong mô hình hồi quy bội. Do đó, việc kiểm soát đối với tất cả các yếu tố gây nhiễu, lập luận, chúng tôi tách biệt hiệu ứng của yếu tố dự đoán lợi ích.

Tôi đang phát triển sự khó chịu ngày càng tăng với ý tưởng này, chủ yếu dựa trên những nhận xét trái chiều được thực hiện bởi các giáo sư khác nhau của các lớp thống kê của tôi. Họ rơi vào một vài loại chính:

1. Bạn chỉ có thể kiểm soát các đồng biến mà bạn nghĩ ra và đo lường.
Điều này là hiển nhiên, nhưng tôi tự hỏi nếu nó thực sự là nguy hiểm nhất và không thể vượt qua trong tất cả.

2. Cách tiếp cận đã dẫn đến những sai lầm xấu xí trong quá khứ.

Ví dụ, Petitti & Freedman (2005) thảo luận về các nghiên cứu quan sát được điều chỉnh theo thống kê trong nhiều thập kỷ đã đưa ra kết luận không chính xác về tác dụng của liệu pháp thay thế hormone đối với nguy cơ mắc bệnh tim. RCT sau này tìm thấy hiệu ứng gần như ngược lại.

3. Mối quan hệ kết quả dự đoán có thể hành xử kỳ lạ khi bạn kiểm soát các đồng biến.

Yu-Kang Tu, Gunnell, & Gilthorpe (2008) thảo luận về một số biểu hiện khác nhau, bao gồm Nghịch lý của Chúa, Nghịch lý của Simpson và các biến số triệt tiêu.

4. Rất khó để một mô hình duy nhất (hồi quy bội) điều chỉnh đầy đủ cho các hiệp phương sai và đồng thời mô hình hóa mối quan hệ kết quả dự đoán.

Tôi đã nghe điều này được đưa ra như một lý do cho sự vượt trội của các phương pháp như điểm số xu hướng và sự phân tầng trên các yếu tố gây nhiễu, nhưng tôi không chắc là tôi thực sự hiểu nó.

5. Mô hình ANCOVA yêu cầu hiệp phương sai và dự đoán lợi ích phải độc lập.

Tất nhiên, chúng tôi điều chỉnh cho các yếu tố gây nhiễu chính xác BECAUSE chúng có tương quan với yếu tố dự đoán lợi ích, vì vậy, có vẻ như, mô hình sẽ không thành công trong các trường hợp chính xác khi chúng tôi muốn nó nhất. Lập luận cho rằng điều chỉnh chỉ thích hợp để giảm nhiễu trong các thử nghiệm ngẫu nhiên. Miller & Chapman, 2001 đưa ra một đánh giá tuyệt vời.

Vì vậy, câu hỏi của tôi là:

  1. Những vấn đề này nghiêm trọng đến mức nào và những vấn đề khác mà tôi có thể không biết?
  2. Tôi sợ đến mức nào khi thấy một nghiên cứu "kiểm soát mọi thứ"?

(Tôi hy vọng câu hỏi này không đi quá xa vào lãnh thổ thảo luận và vui vẻ mời bất kỳ đề xuất nào để cải thiện nó.)

EDIT : Tôi đã thêm điểm 5 sau khi tìm thấy một tài liệu tham khảo mới.


1
Đối với câu hỏi 2, tôi nghĩ rằng 'kiểm soát mọi thứ' là vấn đề chung hơn về đặc điểm kỹ thuật. Tôi gặp khó khăn khi nghĩ về một tình huống trong đó một mô hình tham số được chỉ định chính xác. Điều đó đang được nói, một mô hình đơn giản hóa thực tế, và đó là nơi nghệ thuật của loại nghiên cứu này nằm. Các nhà nghiên cứu phải quyết định những gì là và không quan trọng trong mô hình.
kirk

4
Với câu hỏi này, bạn đã khiến tôi trở thành một người hâm mộ.
rolando2

1
Tôi nghĩ rằng điều này làm tăng một số điểm rất tốt; nhưng tôi nghĩ rằng các câu trả lời nằm ngoài lĩnh vực thống kê nghiêm ngặt. Do đó, bất kỳ kết quả thống kê nào cũng có giá trị hơn nếu nó 1) Được sao chép 2) Thực sự khả thi, v.v. Cũng xem các tiêu chí MAGIC và lập luận chung mà Abelson đưa ra.
Peter Flom - Tái lập Monica

1
Điểm # 5 là hoàn toàn sai. Bài báo Miller & Chapman hoàn toàn sai, dừng hoàn toàn.
Jake Westfall

1
@ Half-pass Không chắc chắn điều gì khác để nói về điều đó ngoài yêu cầu trung tâm của bài báo - tức là, dự đoán đầu mối X và hiệp biến C phải không được thông báo - chỉ là không đúng. Lưu ý rằng ANCOVA chỉ là một mô hình hồi quy, do đó, cùng một lý luận này rõ ràng sẽ vô hiệu hóa gần như tất cả các sử dụng trong thế giới thực của nhiều hồi quy! Tôi đã có một số cuộc thảo luận trên Twitter về bài báo khủng khiếp này vài tháng trước: twitter.com/CookieSci/status/902298218494644228
Jake Westfall

Câu trả lời:


4

Có một câu trả lời được chấp nhận rộng rãi, không thống kê, có lẽ là câu trả lời - những giả định nào người ta cần đưa ra để khẳng định một người đã thực sự kiểm soát các hiệp phương sai.

Điều đó có thể được thực hiện với đồ thị nhân quả của Judea Pearl và tính toán .

Xem http://ftp.cs.ucla.edu/pub/stat_ser/r402.pdf cũng như các tài liệu khác trên trang web của mình.

Bây giờ là các nhà thống kê, chúng tôi biết rằng tất cả các mô hình đều sai và câu hỏi thống kê thực sự là những giả định được xác định có thể không quá sai để câu trả lời của chúng tôi gần như ổn. Pearl nhận thức được điều này và thảo luận về nó trong công việc của mình nhưng có lẽ không rõ ràng và thường đủ để tránh làm phiền nhiều nhà thống kê với yêu cầu của anh ta để có câu trả lời (mà tôi tin rằng anh ta làm với những giả định mà người ta cần phải đưa ra? ).

(Hiện tại ASA đang cung cấp một giải thưởng cho tài liệu giảng dạy để đưa các phương pháp này vào các khóa học thống kê xem tại đây )


Tham khảo tuyệt vời cho một đại diện đồ họa thanh lịch, cảm ơn bạn.
một nửa vượt qua

0

Trả lời câu hỏi 1:

  • Mức độ nghiêm trọng được đánh giá tốt nhất theo cách theo ngữ cảnh (nghĩa là nên xem xét tất cả các yếu tố góp phần vào tính hợp lệ).
  • Mức độ nghiêm trọng không nên được đánh giá theo một cách phân loại. Một ví dụ là khái niệm về hệ thống suy luận cho các thiết kế nghiên cứu (ví dụ: báo cáo trường hợp là thấp nhất và RCT là cao nhất về mặt phân loại). Loại chương trình này thường được dạy trong các trường y như là một heuristic dễ dàng để nhanh chóng xác định bằng chứng chất lượng cao. Vấn đề với kiểu suy nghĩ này là nó có tính thuật toán và tính quyết định quá mức trong thực tế, câu trả lời tự nó đã quá hạn chế. Khi điều này xảy ra, bạn có thể bỏ lỡ những cách mà RCT được thiết kế kém có thể mang lại kết quả tồi tệ hơn so với một nghiên cứu quan sát được thiết kế tốt.
  • Xem đánh giá dễ đọc này để thảo luận đầy đủ về các điểm nêu trên dưới góc nhìn của một nhà dịch tễ học (Rothman, 2014) .

Trả lời cho câu hỏi 2:

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.