Làm thế nào tôi có thể sửa lỗi đo lường trong biến phụ thuộc trong hồi quy logit?


8

Tôi đang chạy một hồi quy logit nhị phân trong đó tôi biết biến phụ thuộc bị sai lệch trong một tỷ lệ nhỏ các trường hợp. Vì vậy, tôi đang cố gắng ước tính trong mô hình này:β

prob(yi)=1/(1+ezi)

zi=α+Xiβ

Nhưng thay vì vectơ , tôi có , bao gồm một số lỗi ngẫu nhiên (ví dụ: , nhưng hoặc ngược lại, đối với một số ).YY~yi=1yi~=0i

Có một sửa chữa (hợp lý) đơn giản cho vấn đề này?

Tôi biết rằng logit có một số tính chất tốt trong các nghiên cứu kiểm soát trường hợp. Có vẻ như điều gì đó tương tự được áp dụng ở đây, nhưng tôi chưa thể tìm ra giải pháp tốt.

Một vài hạn chế khác: đây là một ứng dụng khai thác văn bản, vì vậy kích thước của rất lớn (trong hàng nghìn hoặc hàng chục nghìn). Điều này có thể loại trừ một số thủ tục tính toán chuyên sâu.X

Ngoài ra, tôi không quan tâm đến việc ước tính chính xác , chỉ .αβ

Câu trả lời:


2

Tình trạng này thường được gọi là lỗi phân loại sai. Bài viết này giúp tôi ước tính chính xác . EDIT: Tôi đã tìm thấy các bài báo có liên quan bằng cách sử dụng http://www.google.com/search?q=mis classification + of + depeper + variable + logistic .β


1
Theo bản tóm tắt, bài báo này dường như đề cập đến một "hiệp phương sai nhị phân dễ bị lỗi": nghĩa là chỉ với các biến độc lập được phân loại sai .
whuber

1
Trên thực tế, các thỏa thuận trừu tượng với cả hai: "Để phân loại sai kết quả, chúng tôi lập luận rằng phân tích dựa trên khả năng là cách tiếp cận sạch nhất và thích hợp nhất. Trong trường hợp phân loại sai đồng biến, chúng tôi kết hợp [....]
rolando2

2

Bạn có thể ước tính mô hình tham số của lỗi bằng MLE hoặc bạn có thể sử dụng phương pháp bán thông số dựa trên một cái gì đó như công cụ ước tính tương quan xếp hạng tối đa (MRC). Tính toán, MRC bị cấm đối với các mẫu lớn, vì vậy có vẻ như MLE là phương pháp phù hợp với tôi.

Cảm ơn GaBorgulya vì một số hướng tốt, kịp thời, đặc biệt là về thuật ngữ "lỗi phân loại sai."

Dưới đây là một số nguồn tốt về chủ đề:

Mô hình cơ bản, chính xác như được mô tả trong bài toán ban đầu

Phiên bản ủng hộ của cùng

Một mô hình phức tạp hơn, nhưng tổng quát hơn

Một cái nhìn tổng quan đẹp

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.