Từ những gì tôi đã đọc, trong số những người khác trên trang web của các thử nghiệm tỷ lệ khả năng của nhóm tư vấn thống kê UCLA và các thử nghiệm wald khá giống nhau trong việc kiểm tra xem hai mô hình glm có cho thấy sự khác biệt đáng kể về sự phù hợp cho một tập dữ liệu hay không (xin lỗi nếu từ ngữ của tôi có thể là một chút tắt). Về bản chất tôi có thể so sánh hai mô hình và kiểm tra nếu mô hình thứ hai cho thấy sự phù hợp tốt hơn đáng kể so với mô hình đầu tiên, hoặc không có sự khác biệt giữa các mô hình.
Vì vậy, các thử nghiệm LR và Wald sẽ hiển thị cùng giá trị p ballpark cho các mô hình hồi quy tương tự. Ít nhất là cùng một kết luận nên được đưa ra.
Bây giờ tôi đã làm cả hai thử nghiệm cho cùng một mô hình trong R và nhận được kết quả khác nhau. Đây là kết quả từ R cho một mô hình:
> lrtest(glm(data$y~1),glm(data$y~data$site_name,family="poisson"))
Likelihood ratio test
Model 1: data$y ~ 1
Model 2: data$y ~ data$site_name
#Df LogLik Df Chisq Pr(>Chisq)
1 2 -89.808
2 9 -31.625 7 116.37 < 2.2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> lrtest(glm(data$y~1,family="poisson"),glm(data$y~data$site_name,family="poisson"))
Likelihood ratio test
Model 1: data$y ~ 1
Model 2: data$y ~ data$site_name
#Df LogLik Df Chisq Pr(>Chisq)
1 1 -54.959
2 9 -31.625 8 46.667 1.774e-07 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> waldtest(glm(data$y~data$site_name,family="poisson"))
Wald test
Model 1: data$y ~ data$site_name
Model 2: data$y ~ 1
Res.Df Df F Pr(>F)
1 45
2 53 -8 0.7398 0.6562
> waldtest(glm(data$y~1,family="poisson"),glm(data$y~data$site_name,family="poisson"))
Wald test
Model 1: data$y ~ 1
Model 2: data$y ~ data$site_name
Res.Df Df F Pr(>F)
1 53
2 45 8 0.7398 0.6562
Về dữ liệu, dữ liệu $ y chứa dữ liệu đếm và dữ liệu $ site_name là một yếu tố có 9 cấp độ. Có 54 giá trị trong dữ liệu $ y, với 6 giá trị cho mỗi cấp dữ liệu $ site_name.
Dưới đây là phân phối tần số:
> table(data$y)
0 2 4 5 7
50 1 1 1 1
> table(data$y,data$site_name)
Andulay Antulang Basak Dauin Poblacion District 1 Guinsuan Kookoo's Nest Lutoban Pier Lutoban South Malatapay Pier
0 6 6 6 4 6 6 6 5 5
2 0 0 0 0 0 0 0 1 0
4 0 0 0 1 0 0 0 0 0
5 0 0 0 0 0 0 0 0 1
7 0 0 0 1 0 0 0 0 0
Bây giờ dữ liệu này không phù hợp với phân phối poisson rất tốt do sự phân tán quá lớn của số không. Nhưng với một mô hình khác, trong đó dữ liệu $ y> 0 phù hợp với mô hình poisson khá tốt và trong khi sử dụng mô hình poisson bằng 0, tôi vẫn nhận được kết quả thử nghiệm rất khác biệt và kết quả thấp nhất. Ở đó, bài kiểm tra wald cho thấy giá trị p là 0,03 trong khi lrtest có giá trị p là 0,0003. Vẫn là một yếu tố khác biệt 100, mặc dù kết luận có thể giống nhau.
Vì vậy, những gì tôi hiểu không chính xác ở đây với tỷ lệ khả năng so với waldtest?