P( Z> z) = điểm kinh nghiệm( - z) / ( 1 + điểm kinh nghiệm( - z) )
P( Z> z) = điểm kinh nghiệm( - z)Ôitôi j= Tôi( YTôi≥ j ), (Tôi tin) các tần số tế bào là độc lập có điều kiện, và do đó có thể được mô hình hóa thông qua mô hình log-linear, đó chỉ là hồi quy Poisson. Điều này là yên tâm bởi vì việc giải thích các hệ số Poisson là một tỷ lệ tương đối. Mô hình hóa sự tương tác giữa biến trả lời là kết quả số và hệ số hồi quy dẫn đến việc giải thích chính xác.
Đó là, phù hợp với mô hình log-linear:
đăng nhập( Ntôi j| YTôi, Xtôi ,) = η0Tôi( YTôi= 0 ) + ... + ηjTôi( YTôi= = = J ) + β⃗ Xtôi ,+ γ⃗ tã (Y) Xtôi ,
Sử dụng ví dụ từ gói MASS: chúng tôi thấy hiệu quả mong muốn rằng rủi ro tương đối nhỏ hơn nhiều so với OR trong mọi trường hợp:
newData <- data.frame('oy'=oy, 'ny'=as.numeric(y), housing)
## trick: marginal frequencies are categorical but interactions are linear
## solution: use linear main effect and add indicators for remaining n-2 categories
## equivalent model specifications
fit <- glm(Freq ~ oy.2 + ny*(Infl + Type + Cont), data=newData, family=poisson)
effects <- grep('ny:', names(coef(fit)), value=T)
print(cbind(
coef(summary(fit))[effects, ],
coef(summary(house.plr))[gsub('ny:','', effects), ]
), digits=3)
Cung cấp cho chúng tôi:
Estimate Std. Error z value Pr(>|z|) Value Std. Error t value
ny:InflMedium 0.360 0.0664 5.41 6.23e-08 0.566 0.1047 5.41
ny:InflHigh 0.792 0.0811 9.77 1.50e-22 1.289 0.1272 10.14
ny:TypeApartment -0.299 0.0742 -4.03 5.55e-05 -0.572 0.1192 -4.80
ny:TypeAtrium -0.170 0.0977 -1.74 8.21e-02 -0.366 0.1552 -2.36
ny:TypeTerrace -0.673 0.0951 -7.07 1.51e-12 -1.091 0.1515 -7.20
ny:ContHigh 0.106 0.0578 1.84 6.62e-02 0.360 0.0955 3.77
Trong đó 4 cột đầu tiên được suy luận từ mô hình log-linear và 3 cột thứ hai đến từ mô hình tỷ lệ cược tỷ lệ.
Câu trả lời này có lẽ là câu hỏi quan trọng nhất: làm thế nào để phù hợp với một mô hình như vậy. Tôi nghĩ rằng nó có thể được sử dụng để khám phá (các) xấp xỉ tương đối của OR cho các sự kiện hiếm gặp đối với RR.