Mô hình nhị phân (Probit và Logit) với Offset logarit


12

Có ai có nguồn gốc làm thế nào một phần bù hoạt động trong các mô hình nhị phân như probit và logit không?

Trong vấn đề của tôi, cửa sổ theo dõi có thể khác nhau về chiều dài. Giả sử bệnh nhân được tiêm ngừa như điều trị. Ảnh này xảy ra ở các thời điểm khác nhau, vì vậy nếu kết quả là một chỉ số nhị phân cho dù có bất kỳ hiện tượng bùng phát nào xảy ra hay không, bạn cần điều chỉnh vì thực tế là một số người có nhiều thời gian hơn để biểu hiện các triệu chứng. Có vẻ như xác suất bùng phát tỷ lệ thuận với độ dài của thời gian theo dõi. Về mặt toán học, tôi không rõ về cách thức một mô hình nhị phân với phần bù bắt được trực giác này (không giống với Poisson).

Phần bù là một tùy chọn tiêu chuẩn trong cả Stata (tr.1666)R , và tôi có thể dễ dàng thấy nó cho Poisson , nhưng trường hợp nhị phân hơi mờ.

Ví dụ: nếu chúng ta có đây là đại số tương đương với một mô hình nơi E[y| x]=exp{x'β+logZ

E[y|x]Z=exp{xβ},
đó là mô hình chuẩn với hệ số trên log Z hạn chế đến 1 . Điều này được gọi làbù logarit. Tôi đang gặp khó khăn để tìm ra cách thức hoạt động này nếu chúng ta thay thế exp { } với Φ ( ) hoặc Λ
E[y|x]=exp{xβ+logZ},
logZ1exp{}Φ() .Λ()

Cập nhật số 1:

Các trường hợp logit đã được giải thích dưới đây.

Cập nhật số 2:

Dưới đây là một lời giải thích về những gì dường như là việc sử dụng chính cho các mô hình không phải là poisson như probit. Phần bù có thể được sử dụng để tiến hành kiểm tra tỷ lệ khả năng trên các hệ số của hàm chỉ số. Trước tiên, bạn ước tính mô hình không ràng buộc và lưu trữ các ước tính. Giả sử bạn muốn kiểm tra giả thuyết rằng . Sau đó, bạn tạo biến z = 2 x , khớp với mô hình thả x và sử dụng z làm phần bù không logarit. Đây là mô hình bị hạn chế. Các thử nghiệm LR so sánh cả hai và là một thay thế cho thử nghiệm Wald thông thường.βx=2z=2xxz

Câu trả lời:


8

Bạn luôn có thể bao gồm một phần bù trong bất kỳ GLM nào : đó chỉ là một biến dự đoán có hệ số cố định là 1. Hồi quy Poisson chỉ là trường hợp sử dụng rất phổ biến.

Lưu ý rằng trong mô hình nhị thức, sự tương tự với phơi nhiễm log như một phần bù chỉ là mẫu số nhị thức, do đó thường không cần phải xác định rõ ràng. Giống như bạn có thể mô hình hóa một chiếc Poisson RV như một số đếm với phơi nhiễm log như một phần bù hoặc theo tỷ lệ với độ phơi sáng theo trọng số, bạn có thể mô hình tương tự một RV nhị thức như là số lần thành công và thất bại, hoặc theo tần số với các thử nghiệm như trọng lượng.

logZZp/(1p)

log(p/(1p))=βX+logZp/(1p)=Zexp(βX)

Nhưng điều này không có bất kỳ ý nghĩa đặc biệt nào như phơi nhiễm log trong hồi quy Poisson. Điều đó nói rằng, nếu xác suất nhị thức của bạn đủ nhỏ, một mô hình logistic sẽ tiếp cận mô hình Poisson bằng liên kết nhật ký (vì mẫu số trên LHS tiếp cận 1) và phần bù có thể được coi là thuật ngữ phơi nhiễm log.

(Vấn đề được mô tả trong câu hỏi R được liên kết của bạn khá bình dị.)


Pr(Y=1|X)=Φ(xβ+ln(t))tt

Đó không phải là xác suất, mà là tỷ lệ cược. Hy vọng rằng chỉnh sửa làm cho nó rõ ràng hơn.
Hồng Ooi

Thể hiện vấn đề về tỷ lệ cược làm cho nó rất rõ ràng. Thế còn probit thì sao?
Dimitriy V. Masterov

Φ()

@StasK Điều đó có vẻ đúng, nhưng tại sao các tùy chọn này tồn tại trong Stata và R? Họ làm gì?
Dimitriy V. Masterov

1

Gọi lại đây là một vấn đề theo thời gian, liệu một mô hình logistic có bù ln (thời gian) có hiệu quả đưa bạn đến một hàm tồn tại tham số có thể phù hợp với dữ liệu không?

p / (1-p) = Z * exp (xbeta)

p = [Z * exp (xbeta)] / [1 + Z * exp (xbeta)]

Tỷ lệ sống dự đoán tại thời điểm Z = 1- [Z * exp (xbeta)] / [1 + Z * exp (xbeta)]

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.