Có thể thực hiện hồi quy trong đó bạn có một biến tính năng không xác định / không thể biết được không?


7

Có thể thực hiện hồi quy trong đó bạn có một biến tính năng không xác định / không thể biết được không?

Giả sử tôi có nhưng tôi không / không thể đo giá trị của biến tính năng . Tôi vẫn có thể thực hiện hồi quy để xác định các hệ số chứ?yn= =một0+một1x1+một2x2+một3x3x3mộtTôi

Nếu tôi có một số kiến ​​thức về số liệu thống kê về cách được phân phối thì sao? Nếu tôi biết rằng được rút ra từ phân phối Gaussian , với biết, điều này có cho phép tôi thực hiện hồi quy để xác định các giá trị của không?x3x3N(0,σ2)σmộtTôi


4
Không, làm thế nào bạn biết cái gì là do tính năng và cái gì là ngẫu nhiên?
dùng2974951

7
Nếu có thể, thế giới sẽ tươi đẹp! Chỉ cần tưởng tượng: không có bộ sưu tập dữ liệu! không có dữ liệu lộn xộn! không có ai gửi dữ liệu cho bạn dưới dạng ảnh chụp màn hình được nhúng trong tài liệu Word ...
ukasz Deryło

Cảm ơn câu trả lời, chỉ muốn một số xác nhận rằng đây là trường hợp như tôi nghi ngờ. Tôi đoán người ta vẫn có thể thực hiện hồi quy trên các biến tính năng khác nếu hiệu ứng của rất yếu so với các biến tính năng khác và do đó có thể bị bỏ qua hoàn toàn, nhưng trong trường hợp đó là hồi quy đóng góp lớn là không thể. x3
Một số nhà nghiên cứu vật lý học

@ user2974951 Tại sao không biến điều đó thành câu trả lời? Tôi thậm chí không nghĩ rằng bạn sẽ cần phải mở rộng về điều đó.
mkt - Tái lập lại

Một mô hình không gian nhà nước thì sao?
Chris Haug

Câu trả lời:


13

Công thức hoàn chỉnh cho mô hình tuyến tính là (ở dạng ma trận gần đúng)

Y= =βX+ε

Vì vậy, chúng tôi có nhiều hệ số cho các biến mà chúng tôi đang kiểm soát và sau đó chúng tôi có , đó là mọi thứ khác mà chúng tôi không giải thích với các biến được bao gồm của chúng tôi.ε

Trong thuật ngữ lỗi này thuộc về tất cả các biến mà chúng tôi không xem xét, vì chúng tôi không có thông tin cho chúng hoặc vì đơn giản là chúng tôi không biết về chúng (độ lệch ngẫu nhiên).

Vì vậy, không có cách nào để bạn biết những gì trong thuật ngữ này thuộc về những gì chưa biết.


1
Nâng cao cho sự xuất sắc và rõ ràng của câu trả lời.
James Phillips

3

Làm thế nào về nếu tôi có một số kiến ​​thức về số liệu thống kê về cách x3 được phân phối?

Nếu bạn làm hồi quy của y trên x1x2, sau đó nếu bạn sẵn sàng để đoán x3 tương quan với từng yếu tố này, bạn có thể tính toán những gì những dự đoán này sẽ đòi hỏi về cách các hệ số bạn ước tính sẽ thay đổi nếu bạn có thể quan sát x3 và chạy hồi quy đầy đủ.

Giả sử ví dụ rằng x3 không tương quan với x1. Sau đó

α2,your regression=α2,full regression+α3cov(x3,x2)var(x2)

Vì vậy nếu x3 có khả năng chỉ tương quan yếu với y hoặc là x1x2không có nhiều thay đổi Và nếu có, bạn có thể sử dụng các công thức sai lệch biến thiên này để dự đoán mọi thứ sẽ thay đổi như thế nào.


0

Luôn luôn có thể ... nhưng ước tính của bạn sẽ bị sai lệch trong nhiều trường hợp. Trường hợp thuận lợi nhất xảy ra:
(a) Khix3n không tương quan với các biến hồi quy khác, trong trường hợp này, hồi quy yn trên (ι,x1,x2) và bạn có ước tính không thiên vị về một0,một1,một2(Định lý Frish-Waugh-Lovell)
(b) Nếu ngoài (a) bạn biếtσx3~N(0,σ2), sau đó bạn thậm chí có thể xác định một3: vẽ tranh N giá trị iid cho x3n~N(0,σ2) và hồi quy yn trên (ι,x1,x2,x3).


Bạn có thể giải thích thêm làm thế nào để thực hiện hồi quy trong tình huống (b)? Bạn có tạo ra các giá trị cho ẩn số khôngx3 bằng cách vẽ chúng từ N(0,σ2)và sau đó thoái lui về điều đó?
Một số nhà nghiên cứu vật lý học

Vâng, đây là cách để làm điều đó. Có thể lặp lại việc tạo và ước tính số ngẫu nhiên, nhưng điều này có vẻ không thú vị trong trường hợp đơn giản của bạn. Có một tài liệu đang phát triển về các phương pháp dựa trên mô phỏng sử dụng một cách tiếp cận tương tự, nhưng chúng có liên quan nhiều hơn một chút so với ví dụ của bạn: ví dụ, xem Gouriéroux và Monfort. Xem thêm mô tả sư phạm trong texbook của Cameron và Trivingi (2005).
Bertrand
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.