Sự khác biệt giữa kiểm soát một biến trong mô hình hồi quy so với kiểm soát một biến trong thiết kế nghiên cứu của bạn là gì?


11

Tôi tưởng tượng rằng việc kiểm soát một biến trong thiết kế nghiên cứu của bạn có hiệu quả hơn trong việc giảm lỗi hơn là kiểm soát biến sau đó trong mô hình hồi quy của bạn.

Ai đó có thể giải thích chính thức hai trường hợp "kiểm soát" này khác nhau như thế nào không? Làm thế nào tương đối hiệu quả là họ trong việc giảm lỗi và mang lại dự đoán chính xác hơn?

Câu trả lời:


13

Bằng cách "kiểm soát một biến trong thiết kế nghiên cứu của bạn", tôi giả sử bạn có nghĩa là làm cho một biến không đổi trên tất cả các đơn vị nghiên cứu hoặc thao tác một biến để mức độ của biến đó được đặt độc lập cho từng đơn vị nghiên cứu. Đó là, kiểm soát một biến trong thiết kế nghiên cứu của bạn có nghĩa là bạn đang tiến hành một thử nghiệm thực sự . Lợi ích của việc này là nó có thể giúp suy luận nhân quả .

Về lý thuyết, việc kiểm soát một biến trong mô hình hồi quy của bạn cũng có thể giúp suy ra nguyên nhân. Tuy nhiên, đây chỉ là trường hợp nếu bạn kiểm soát mọi biến có kết nối nhân quả trực tiếp với phản hồi. Nếu bạn bỏ qua một biến như vậy (có lẽ bạn không biết bao gồm biến đó) và nó có tương quan với bất kỳ biến nào khác, thì suy luận nguyên nhân của bạn sẽ bị sai lệch và không chính xác. Trong thực tế, chúng tôi không biết tất cả các biến có liên quan, vì vậy kiểm soát thống kê là một nỗ lực khá nguy hiểm dựa trên các giả định lớn mà bạn không thể kiểm tra.

Tuy nhiên, câu hỏi của bạn hỏi về "giảm lỗi và mang lại dự đoán chính xác hơn", không suy ra nguyên nhân. Đây là một vấn đề khác nhau. Nếu bạn tạo một biến số nhất định thông qua thiết kế nghiên cứu của mình, tất cả các biến đổi trong phản hồi do biến đó sẽ bị loại bỏ. Mặt khác, nếu bạn chỉ đơn giản kiểm soát một biến, bạn đang ước tính tác động của nó có thể bị lỗi lấy mẫu ở mức tối thiểu. Nói cách khác, về lâu dài, kiểm soát thống kê sẽ không tốt bằng việc giảm phương sai còn lại trong mẫu của bạn.

Nhưng nếu bạn quan tâm đến việc giảm lỗi và nhận được các dự đoán chính xác hơn, có lẽ bạn chủ yếu quan tâm đến các thuộc tính mẫu, chứ không phải độ chính xác trong mẫu của bạn. Và trong đó nằm chà. Khi bạn điều khiển một biến bằng cách thao tác nó dưới một hình thức nào đó (giữ nó không đổi, v.v.), bạn tạo ra một tình huống giả tạo hơn so với quan sát tự nhiên ban đầu. Đó là, các thí nghiệm có xu hướng có giá trị / tính tổng quát bên ngoài ít hơn so với các nghiên cứu quan sát.


Trong trường hợp không rõ ràng, một ví dụ về một thí nghiệm thực sự giữ một thứ gì đó không đổi có thể đang đánh giá một phương pháp điều trị trong mô hình chuột bằng cách sử dụng chuột lai giống hệt nhau về mặt di truyền. Mặt khác, một ví dụ về việc kiểm soát cho một biến có thể đại diện cho lịch sử gia đình của bệnh bởi một mã giả và kể cả biến trong một mô hình hồi quy đa biến (x, chính xác như thế một “điều khiển cho các biến khác”? , Và như thế nào có thể thêm IV thứ 2 làm cho IV thứ nhất có ý nghĩa không? ).


1
Giải thích tuyệt vời! @gung
Aaron Zeng
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.