Từ Dịch tễ học hiện đại Phiên bản thứ 3 của Rothman, Greenland và Lash:
Có ít nhất ba hình thức vượt qua. Đầu tiên đề cập đến kết hợp có hại cho hiệu quả thống kê, chẳng hạn như đối sánh trường hợp kiểm soát trường hợp trên một biến liên quan đến phơi nhiễm nhưng không phải là bệnh. Thứ hai đề cập đến kết hợp có hại cho tính hợp lệ, chẳng hạn như khớp trên trung gian giữa phơi nhiễm và bệnh. Thứ ba đề cập đến kết hợp có hại cho hiệu quả chi phí.
Câu trả lời từ AndyW là về hình thức vượt trội thứ hai. Tóm lại, đây là cách tất cả chúng hoạt động:
1: Để trở thành một người gây nhiễu, một trong những tiêu chí là hiệp phương sai được liên kết với cả kết quả và phơi nhiễm. Nếu nó chỉ liên quan đến một trong số họ, thì đó không phải là một yếu tố gây nhiễu và tất cả những gì bạn đã thành công là mở rộng khoảng tin cậy của bạn.
Để khám phá loại vượt trội này hơn nữa, hãy xem xét một nghiên cứu kiểm soát trường hợp phù hợp về phơi nhiễm nhị phân, với một điều khiển phù hợp với từng trường hợp trên một hoặc nhiều yếu tố gây nhiễu. Mỗi tầng trong phân tích sẽ bao gồm một trường hợp và một điều khiển trừ khi một số tầng có thể được kết hợp. Nếu trường hợp và điều khiển trùng khớp của cả hai được phơi bày hoặc cả hai đều không phơi sáng, một lề của bảng 2 x 2 sẽ là 0 ... một cặp đối tượng như vậy sẽ không đóng góp bất kỳ thông tin nào cho phân tích. Nếu phân tầng theo tương quan phơi nhiễm, người ta sẽ tăng khả năng các bảng như vậy sẽ xảy ra và do đó có xu hướng tăng thông tin bị mất trong phân tích phân tầng.
2: Điều này được thảo luận một phần bởi AndyW. Kết hợp trên một yếu tố trung gian sẽ làm sai lệch ước tính của bạn, cũng như phù hợp với điều gì đó bị ảnh hưởng bởi cả tiếp xúc và kết quả. Điều này về cơ bản là kiểm soát trên máy va chạm và bất kỳ kỹ thuật nào làm như vậy sẽ làm sai lệch ước tính của bạn.
Tuy nhiên, nếu yếu tố phù hợp tiềm năng bị ảnh hưởng bởi phơi nhiễm và yếu tố lần lượt ảnh hưởng đến bệnh (nghĩa là biến trung gian) hoặc bị ảnh hưởng bởi cả phơi nhiễm và bệnh, thì việc kết hợp trên yếu tố sẽ làm sai lệch cả hiệu ứng thô và điều chỉnh ước tính. Trong những tình huống này, kết hợp điều khiển trường hợp không gì khác hơn là một dạng sai lệch lựa chọn không thể sửa chữa.
3: Đây là một vấn đề thiết kế nghiên cứu nhiều hơn. Kết hợp rộng rãi trên các biến mà bạn không phù hợp vì lý do 1 & 2 có thể khiến bạn từ chối các điều khiển dễ dàng có được (bạn bè, gia đình, mạng xã hội gần đó, v.v.) để có được các điều khiển có thể phù hợp hơn rất nhiều tập hợp không cần thiết. Đó là chi phí tiền - tiền có thể đã được chi cho nhiều đối tượng hơn, tiếp xúc tốt hơn hoặc xác định bệnh tật, v.v., không có lợi ích đáng kể về thiên vị hoặc độ chính xác, và thực sự đã đe dọa cả hai.