Tôi đang chạy một hồi quy logit nhị phân trong đó tôi biết biến phụ thuộc bị sai lệch trong một tỷ lệ nhỏ các trường hợp. Vì vậy, tôi đang cố gắng ước tính trong mô hình này:
Nhưng thay vì vectơ , tôi có , bao gồm một số lỗi ngẫu nhiên (ví dụ: , nhưng hoặc ngược lại, đối với một số ).
Có một sửa chữa (hợp lý) đơn giản cho vấn đề này?
Tôi biết rằng logit có một số tính chất tốt trong các nghiên cứu kiểm soát trường hợp. Có vẻ như điều gì đó tương tự được áp dụng ở đây, nhưng tôi chưa thể tìm ra giải pháp tốt.
Một vài hạn chế khác: đây là một ứng dụng khai thác văn bản, vì vậy kích thước của rất lớn (trong hàng nghìn hoặc hàng chục nghìn). Điều này có thể loại trừ một số thủ tục tính toán chuyên sâu.
Ngoài ra, tôi không quan tâm đến việc ước tính chính xác , chỉ .