Tôi có một câu hỏi triết học liên quan đến sai lệch biến thiên.
Chúng tôi có mô hình hồi quy điển hình (mô hình dân số) trong đó các mẫu đến từ , và sau đó là một bó điều kiện theo đó các ước tính OLS hoạt động khá tốt.( Y , X 1 , . . . , X n )
Sau đó, chúng tôi biết rằng, nếu chúng tôi bỏ qua một trong các biến chính, , điều này có thể sai lệch các ước tính của . Điều này ít nhất sẽ ảnh hưởng đến tác động ước tính của phần còn lại của các biến đối với và cả các thử nghiệm giả thuyết về \ beta_1, \ beta_2, ... , vì các giá trị dự đoán không đáng tin cậy.β 0 , β 1 , . . . , β k - 1 , β k + 1 , . . . , Β n Y beta 1 , β 2 , . . .
Vấn đề là, chúng ta không biết biến nào trong mô hình dân số thực sự. Thay vào đó, chúng tôi có một loạt các ứng cử viên mà từ đó chúng tôi nên phân tích và tìm ra tập hợp con phù hợp nhất. Quá trình lựa chọn biến này sử dụng các ước tính OLS và kiểm tra giả thuyết một lần nữa. Dựa vào đó, chúng tôi từ chối hoặc bao gồm các biến khác nhau. Nhưng vì mỗi mô hình ứng cử viên đang bỏ qua các biến có liên quan (bạn sẽ không bao giờ có thể tìm thấy mô hình thực sự), các quyết định này có dựa trên kết quả sai lệch không? Tại sao sau đó, chúng ta nên tin tưởng họ?
(Tôi đang nghĩ về phương pháp chuyển tiếp từng bước, ví dụ, trong đó bạn chọn một biến sau đó thêm phần còn lại. Bạn so sánh các mô hình đang suy luận và tôi nghĩ rằng các biến bị bỏ qua có thể làm phiền mọi thứ.)
Tôi chưa bao giờ quá lo lắng về chủ đề này cho đến khi tôi bắt đầu nghĩ về nó, và tôi chắc chắn rằng mình đã sai ở đâu đó.
samples from (Y,X1,....Xn) and then a bunch of conditions by which the OLS estimations behave quite well.
là thực sự những gì bạn muốn nói hoặc đã làm một số câu của bạn bị cắt bỏ. Ngoài ra, bạn có một lỗi chính tả trong tiêu đề của câu hỏi.