Biến thiên vượt trội và các biến gây nhiễu


8

Theo tôi hiểu, kết hợp là một cách để xác định quan hệ nhân quả trong các nghiên cứu quan sát. Bằng cách kết hợp các quan sát "tương tự" và so sánh các quan sát đã hoặc không được điều trị, bạn có thể coi đây là một thử nghiệm gần đúng.

Vượt qua là gì? Những loại thiên vị nào nó giới thiệu? Tôi hầu như đã nhìn thấy sự phù hợp từ góc độ kinh tế học, nhưng gần đây đã thấy một số bài báo về dịch tễ học cho thấy rằng "vượt qua" có thể dẫn đến sai lệch. Tôi thấy khó hiểu thuật ngữ của các bài báo và sẽ đánh giá rất cao nếu ai đó có thể giúp giải thích một số khái niệm chính. Dưới đây là một bài viết tham khảo ý tưởng:

Quá khớp có thể gây ra sai lệch. BMJ. Ngày 10 tháng 8 năm 2002; 325 (7359)

Câu trả lời:


11

Từ Dịch tễ học hiện đại Phiên bản thứ 3 của Rothman, Greenland và Lash:

Có ít nhất ba hình thức vượt qua. Đầu tiên đề cập đến kết hợp có hại cho hiệu quả thống kê, chẳng hạn như đối sánh trường hợp kiểm soát trường hợp trên một biến liên quan đến phơi nhiễm nhưng không phải là bệnh. Thứ hai đề cập đến kết hợp có hại cho tính hợp lệ, chẳng hạn như khớp trên trung gian giữa phơi nhiễm và bệnh. Thứ ba đề cập đến kết hợp có hại cho hiệu quả chi phí.

Câu trả lời từ AndyW là về hình thức vượt trội thứ hai. Tóm lại, đây là cách tất cả chúng hoạt động:

1: Để trở thành một người gây nhiễu, một trong những tiêu chí là hiệp phương sai được liên kết với cả kết quả phơi nhiễm. Nếu nó chỉ liên quan đến một trong số họ, thì đó không phải là một yếu tố gây nhiễu và tất cả những gì bạn đã thành công là mở rộng khoảng tin cậy của bạn.

Để khám phá loại vượt trội này hơn nữa, hãy xem xét một nghiên cứu kiểm soát trường hợp phù hợp về phơi nhiễm nhị phân, với một điều khiển phù hợp với từng trường hợp trên một hoặc nhiều yếu tố gây nhiễu. Mỗi tầng trong phân tích sẽ bao gồm một trường hợp và một điều khiển trừ khi một số tầng có thể được kết hợp. Nếu trường hợp và điều khiển trùng khớp của cả hai được phơi bày hoặc cả hai đều không phơi sáng, một lề của bảng 2 x 2 sẽ là 0 ... một cặp đối tượng như vậy sẽ không đóng góp bất kỳ thông tin nào cho phân tích. Nếu phân tầng theo tương quan phơi nhiễm, người ta sẽ tăng khả năng các bảng như vậy sẽ xảy ra và do đó có xu hướng tăng thông tin bị mất trong phân tích phân tầng.

2: Điều này được thảo luận một phần bởi AndyW. Kết hợp trên một yếu tố trung gian sẽ làm sai lệch ước tính của bạn, cũng như phù hợp với điều gì đó bị ảnh hưởng bởi cả tiếp xúc và kết quả. Điều này về cơ bản là kiểm soát trên máy va chạm và bất kỳ kỹ thuật nào làm như vậy sẽ làm sai lệch ước tính của bạn.

Tuy nhiên, nếu yếu tố phù hợp tiềm năng bị ảnh hưởng bởi phơi nhiễm và yếu tố lần lượt ảnh hưởng đến bệnh (nghĩa là biến trung gian) hoặc bị ảnh hưởng bởi cả phơi nhiễm và bệnh, thì việc kết hợp trên yếu tố sẽ làm sai lệch cả hiệu ứng thô và điều chỉnh ước tính. Trong những tình huống này, kết hợp điều khiển trường hợp không gì khác hơn là một dạng sai lệch lựa chọn không thể sửa chữa.

3: Đây là một vấn đề thiết kế nghiên cứu nhiều hơn. Kết hợp rộng rãi trên các biến mà bạn không phù hợp vì lý do 1 & 2 có thể khiến bạn từ chối các điều khiển dễ dàng có được (bạn bè, gia đình, mạng xã hội gần đó, v.v.) để có được các điều khiển có thể phù hợp hơn rất nhiều tập hợp không cần thiết. Đó là chi phí tiền - tiền có thể đã được chi cho nhiều đối tượng hơn, tiếp xúc tốt hơn hoặc xác định bệnh tật, v.v., không có lợi ích đáng kể về thiên vị hoặc độ chính xác, và thực sự đã đe dọa cả hai.


1
(+1) Phản hồi tốt đẹp. Tôi không quá ngạc nhiên khi thấy rằng sách giáo khoa của Rothman & Greenland một lần nữa là một tài liệu tham khảo tốt để giữ trên bàn của chúng tôi, luôn trong tầm tay dễ dàng.
chl

6

Mặc dù tôi cũng không biết gì về thuật ngữ "quá khớp", một ví dụ về ý tưởng tương tự mà tôi đã nghe trong biệt ngữ Kinh tế và Thống kê có thể phù hợp với kết quả "trung gian". Xem bài viết của Andrew Gelman về chủ đề này

Đây là vấn đề tương tự như được mô tả ở đầu bài viết mà bạn trích dẫn ( Marsh et al., 2002 )

Nếu chính sự phơi nhiễm dẫn đến tác nhân gây nhiễu, hoặc có tình trạng tương đương với nó, thì sự phân tầng của kẻ gây nhiễu cũng sẽ phân tầng theo sự phơi nhiễm và mối quan hệ của việc tiếp xúc với bệnh sẽ bị che khuất. Điều này được gọi là quá khớp ...

Gelman đưa ra một ví dụ rõ ràng về mặt khái niệm trong bài viết "Liệu việc làm con trai có khiến bạn bảo thủ hơn". Chỉ trong những thuật ngữ đơn giản (vắng mặt các ví dụ), bạn chỉ cần có hướng đi nhân quả của mình.


1
Đúng. Trong cuốn sách của Josh Angrist Chủ yếu là Kinh tế lượng vô hại, ông đề cập đến những hiện tượng tương tự như một "sự kiểm soát tồi tệ". Ông đưa ra ví dụ về việc hồi quy tiền lương cho giáo dục và nghề nghiệp. Đây là một hồi quy khủng khiếp vì nó đã xác định được sự khác biệt trong giáo dục trong nghề nghiệp (ví dụ: nếu nghề nghiệp là luật sư, việc phân tích những khác biệt về giáo dục đó là vô nghĩa) và giáo dục là điều giúp bạn trở thành một luật sư! Tôi nghi ngờ sự phù hợp quá mức có thể là điều đó. Có lẽ một nhà bác học sẽ đi cùng để xác nhận. Cảm ơn các liên kết Gelman tuyệt vời, tôi sẽ kiểm tra chúng.
d_a_c321

Rất thú vị và tôi nghĩ đó là một chủ đề quan trọng và chưa được thảo luận.
rolando2
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.