Tôi có một dữ liệu trong đó kết quả là tỷ lệ của một loài được quan sát trong một khu vực bằng máy trong 2 ngày riêng biệt. Vì kết quả là một tỷ lệ và không bao gồm 0 hoặc 1, tôi đã sử dụng hồi quy beta để phù hợp với mô hình. Nhiệt độ được sử dụng như một biến độc lập. Đây là một số mã R đồ chơi:
set.seed(1234)
library(betareg)
d <- data.frame(
DAY = c(1,1,1,1,2,2,2,2),
Proportion = c(.4,.1,.25, .25, .5,.3,.1,.1),
MACHINE = c("A","B","C","D","H","G","K","L"),
TEMPERATURE = c(rnorm(8)*100)
)
b <- betareg(Proportion ~ TEMPERATURE,
data= d, link = "logit", link.phi = NULL, type = "ML")
summary(b)
## Call:
## betareg(formula = Proportion ~ TEMPERATURE, data = d, link = "logit", link.phi = NULL, type = "ML")
##
## Standardized weighted residuals 2:
## Min 1Q Median 3Q Max
## -1.2803 -1.2012 0.3034 0.6819 1.6494
##
## Coefficients (mean model with logit link):
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -1.0881982 0.2620518 -4.153 3.29e-05 ***
## TEMPERATURE 0.0003469 0.0023677 0.147 0.884
##
## Phi coefficients (precision model with identity link):
## Estimate Std. Error z value Pr(>|z|)
## (phi) 9.305 4.505 2.066 0.0389 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Ở trên bạn có thể thấy TEMPERATURE
hệ số là .0003469. Số mũ, exp (.0003469) = 1.000347
Cập nhật kết hợp trả lời và bình luận:
Bạn có thể thấy ở đây cách tăng nhiệt độ thêm 1 đơn vị từ -10 đến 10 tăng tỷ lệ
nd <- data.frame(TEMPERATURE = seq(-10, 10, by = 1))
nd$Proportion <- predict(b, newdata = nd)
nd$proportion_ratio <- nd$Proportion/(1 - nd$Proportion)
plot(Proportion ~ TEMPERATURE, data = nd, type = "b")
Giải thích là: Thay đổi 1 đơn vị TEMPERATURE
dẫn đến thay đổi tương đối 1.000347 0,04% trong Proportion
:
Từ khóa có sự thay đổi tương đối vì vậy khi bạn so sánh exp(coef(b))[2]
với nd$proportion_ratio[2] / nd$proportion_ratio[1]
bạn sẽ thấy chúng giống nhau
## ratio of proportion
nd$proportion_ratio[2] / nd$proportion_ratio[1]
exp(coef(b))[2]
nd$proportion_ratio[-1] / nd$proportion_ratio[-20]
Proportion
như tên gọi của nó, thì nó rời rạc, không liên tục và hồi quy logistic có lẽ sẽ phù hợp hơn cho việc mô hình hóa nó.