Kết quả hồi quy có giới hạn trên bất ngờ


9

Tôi cố gắng dự đoán một số điểm cân bằng và thử một số phương pháp hồi quy khác nhau. Một điều tôi nhận thấy là các giá trị dự đoán dường như có một loại giới hạn trên. Đó là, số dư thực tế nằm trong , nhưng dự đoán của tôi đứng đầu khoảng . Biểu đồ sau đây cho thấy số dư thực tế so với số dư dự đoán (dự đoán với hồi quy tuyến tính):[0.0,1.0)0.8

thực tế so với dự đoán

Và đây là hai lô phân phối của cùng một dữ liệu:

phân phối ban đầu

Vì các yếu tố dự đoán của tôi rất sai lệch (dữ liệu người dùng có phân phối luật công suất), tôi đã áp dụng phép chuyển đổi Box-Cox, thay đổi kết quả như sau:

thực tế so với dự đoán sau khi chuyển đổi Box-Cox

phân phối sau khi chuyển đổi Box-Cox

Mặc dù nó thay đổi sự phân phối của các dự đoán, nhưng vẫn có giới hạn trên. Vì vậy, câu hỏi của tôi là:

  • Những lý do có thể cho giới hạn trên như vậy trong kết quả dự đoán là gì?
  • Làm cách nào tôi có thể sửa các dự đoán để tương ứng với phân phối của các giá trị thực tế?

Phần thưởng: Vì phân phối sau khi chuyển đổi Box-Cox dường như tuân theo phân phối của các yếu tố dự đoán được chuyển đổi, nên có thể điều này được liên kết trực tiếp? Nếu vậy, có một biến đổi nào tôi có thể áp dụng, để phù hợp với phân phối cho các giá trị thực tế không?

Chỉnh sửa: Tôi đã sử dụng hồi quy tuyến tính đơn giản với 5 yếu tố dự đoán.


1
Tôi thực sự quan tâm để xem nơi này đi. Đây chỉ là một mô hình hồi quy tuyến tính? Có bao nhiêu dự đoán?
Shadowtalker

1
Như một lưu ý phụ: Vì biến kết quả của bạn được giới hạn bởi 0 và 1, một mô hình hồi quy tuyến tính đơn giản sẽ có khả năng dự đoán các giá trị bên ngoài các giới hạn đó tất nhiên là không hợp lệ. Có những lựa chọn khác để xem xét trong trường hợp này.
COOLSerdash

1
Đầu vào giới hạn ngụ ý đầu ra giới hạn cho một mô hình tuyến tính. Các giới hạn trên các dự đoán (biến đổi) là gì? Bạn có thể chỉ cho chúng tôi một bảng tóm tắt của mô hình phù hợp?
Đức Hồng Y

2
Mennny: Tất cả những gì bạn thực sự cần (để bắt đầu) là các giá trị hệ số và giới hạn trên các yếu tố dự đoán. Bằng cách khớp từng dấu một, bạn có thể nhanh chóng xác định dự đoán tối thiểu và tối đa (giả sử các dự đoán sẽ luôn thỏa mãn các giới hạn, mặc nhiên hoặc rõ ràng).
Đức Hồng Y

1
@cardinal: Tôi đã kiểm tra giới hạn của các yếu tố dự đoán và có thể xác nhận giả định của bạn. Với các dự đoán đã cho (chưa được dịch), dự đoán tối đa là ~ 0,79. Bạn có thể vui lòng "sao chép / dán" nhận xét của mình làm câu trả lời để tôi có thể chấp nhận không? Làm thế nào tôi có thể tiến hành? Tôi đoán điều này cho thấy rằng không có mối quan hệ tuyến tính giữa những người dự đoán của tôi và kết quả?
Mennny

Câu trả lời:


1

Dep var của bạn bị giới hạn trong khoảng từ 0 đến 1 và do đó OLS không hoàn toàn phù hợp, tôi đề nghị hồi quy beta chẳng hạn, và có thể có các phương pháp khác. Nhưng thứ hai, sau khi chuyển đổi hộp-cox, bạn nói rằng dự đoán của bạn bị giới hạn, nhưng biểu đồ của bạn không cho thấy điều đó.


0

Mặc dù có rất nhiều sự tập trung vào việc sử dụng hồi quy tuân theo giới hạn 0/1 và điều này là hợp lý (và quan trọng!), Câu hỏi cụ thể về lý do LPM của bạn không dự đoán kết quả lớn hơn 0,8 là một câu hỏi hơi khác .

Trong cả hai trường hợp, có một mẫu được chú ý trong phần dư của bạn, cụ thể là, mô hình tuyến tính của bạn phù hợp với phần đuôi trên của phân phối của bạn kém. Điều này có nghĩa là có một cái gì đó phi tuyến tính về mô hình chính xác.

Các giải pháp cũng xem xét giới hạn 0/1 của dữ liệu của bạn: probit, logit và hồi quy beta. Điều này rất quan trọng và phải được giải quyết để công việc của bạn được nghiêm ngặt, với mức phân phối tương đối gần với 1 bản phân phối, và do đó, số lượng lớn câu trả lời về chủ đề đó.

Tuy nhiên, thông thường, vấn đề là LPM vượt quá giới hạn 0/1. Đây không phải là trường hợp ở đây! Nếu bạn không quan tâm đến giới hạn 0/1 và chủ động muốn một giải pháp có thể được trang bị (x'x) ^ - 1 (x'y), thì hãy xem xét rằng có lẽ mô hình không phải là tuyến tính rõ ràng. Ghép mô hình dưới dạng hàm của x ^ 2, các sản phẩm chéo của các biến độc lập hoặc nhật ký của các biến độc lập có thể giúp cải thiện mức độ phù hợp của bạn và có thể cải thiện khả năng giải thích của mô hình của bạn để ước tính các giá trị lớn hơn 0,8.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.