Tại sao mọi người thường chạy hồi quy có và không có các biến kiểm soát?


8

Tôi thường chạy hồi quy từ một tập dữ liệu thấp (~ 100 quan sát). Thường thì kết quả chỉ có ý nghĩa với sự bao gồm các biến kiểm soát. Tuy nhiên, tôi thường thấy các bài báo trên tạp chí nơi mọi người (luôn có số lượng lớn các quan sát) tuyên bố đã thực hiện hồi quy "có và không có các biến kiểm soát".

Tại sao mọi người thường chạy hồi quy có và không có các biến kiểm soát?


Vì vậy, nếu tôi chỉ nhận được một kết quả khi tôi kiểm soát thống kê cho một số biến, điều đó có nghĩa là gì?
ChrisStata

Câu trả lời:


5

Một chút về các điều khoản đầu tiên. Theo định nghĩa, biến điều khiển được giữ không đổi trong suốt nghiên cứu, vì vậy bạn không thể sử dụng nó trong hồi quy. Bạn có thể có nghĩa là các biến nên được kiểm soát thống kê cho . Chẳng hạn như hiệp phương sai hoặc các yếu tố chặn (như sau khi thiết kế thử nghiệm khối ngẫu nhiên)

Mọi người chạy hồi quy hoặc ANOVA với các biến như vậy không chỉ để rửa hiệu ứng của chúng khỏi các biến dự đoán mà chủ yếu để kiểm tra xem hiệu ứng của chúng có đáng kể hay không. Nếu nó là quan trọng thì sự bao gồm của họ trong mô hình được bảo hành đầy đủ. Nếu không, họ có thể được loại trừ khỏi mô hình.

Điều này chủ yếu là quan trọng đối với một yếu tố chặn. Nếu bạn để nó trong mô hình mặc dù điều đó không đáng kể, bạn có nguy cơ bỏ lỡ ảnh hưởng của các biến dự đoán do điều khoản trong df Lỗi , - hệ số chặn làm giảm cả Lỗi và df của nó và xuất hiện tình huống cạnh tranh. Tầm quan trọng của các yếu tố dự đoán có thể giảm hoặc tăng tùy thuộc vào "chiến thắng" - sự sụp đổ của Lỗi tổng bình phương của sự sụp đổ của df . Đây có thể là lý do tại sao mọi người đôi khi thích mô hình ngắn gọn hơn.

Một lý do cho điều này có thể là cho mẫu như vừa phải như 100 inclusuion rất nhiều IVs, ngay cả khi tất cả họ đều có vẻ quan trọng hoặc đáng kể, dẫn đến overfitting .


Vâng, xin lỗi, tôi có nghĩa là một biến tôi đang kiểm soát thống kê.
ChrisStata

Cho dù phù hợp hay không, hiệp phương sai thường được gọi là biến kiểm soát hoặc điều khiển trong kinh tế.
Peutch

3

Một lý do nữa để bao gồm các đồng biến là chúng quan trọng trong tài liệu. Nếu bạn có thể chứng minh rằng một số đồng biến đã được tìm thấy có ảnh hưởng lớn trong quá khứ (tự nó hoặc bằng cách ảnh hưởng đến các tham số khác) thì KHÔNG có tác dụng lớn trong nghiên cứu của bạn, thì bạn đã phát hiện ra một điều thú vị.


2

Thông thường, điều này có nghĩa là có một hồi quy với kết quả và biến điều trị. Sau đó, có các điều khiển khác có thể được thêm vào mô hình --- các đồng biến khác có thể quan trọng. Các tác giả đầu tiên chạy một mô hình đơn giản chỉ bao gồm điều trị. Sau đó, họ kiểm tra sự mạnh mẽ của những phát hiện của họ để đưa vào các biến số khác. Cụ thể, họ hỏi liệu việc bao gồm các hiệp phương sai khác có làm giảm hoặc loại bỏ tác động ước tính trong mô hình đơn giản hay không.

Ngoài ra, việc bao gồm các hiệp phương sai khác thường làm giảm các lỗi tiêu chuẩn. Trong trường hợp này, các tác giả có thể thấy rằng tác động ước tính tương đối giống nhau giữa mô hình đơn giản và mô hình bao gồm các điều khiển, nhưng chỉ trong trường hợp sau là ước tính có ý nghĩa (thường, khác 0). Các tác giả sau đó sẽ sử dụng mô hình sau để thực hiện suy luận (kiểm tra giả thuyết, khoảng tin cậy) vì các lỗi tiêu chuẩn nhỏ hơn của nó.


1

Ngoài các câu trả lời ở trên, có một số kỹ thuật lựa chọn đồng biến liên quan đến việc so sánh các mô hình có và không có biến tại chỗ. Và nếu người ta muốn minh họa hiệu quả của việc thêm một hiệp phương sai, mô hình thô (không điều chỉnh) là cần thiết như một tài liệu tham khảo ở nơi đầu tiên.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.