giải thích của betareg coef


8

Tôi có một dữ liệu trong đó kết quả là tỷ lệ của một loài được quan sát trong một khu vực bằng máy trong 2 ngày riêng biệt. Vì kết quả là một tỷ lệ và không bao gồm 0 hoặc 1, tôi đã sử dụng hồi quy beta để phù hợp với mô hình. Nhiệt độ được sử dụng như một biến độc lập. Đây là một số mã R đồ chơi:

set.seed(1234)
library(betareg)
d <- data.frame(
  DAY = c(1,1,1,1,2,2,2,2),
  Proportion = c(.4,.1,.25, .25, .5,.3,.1,.1),
  MACHINE = c("A","B","C","D","H","G","K","L"),
  TEMPERATURE = c(rnorm(8)*100)
)
b <- betareg(Proportion ~ TEMPERATURE,
  data= d, link = "logit", link.phi = NULL, type = "ML")
summary(b)
## Call:
## betareg(formula = Proportion ~ TEMPERATURE, data = d, link = "logit", link.phi = NULL, type = "ML")
## 
## Standardized weighted residuals 2:
##     Min      1Q  Median      3Q     Max 
## -1.2803 -1.2012  0.3034  0.6819  1.6494 
## 
## Coefficients (mean model with logit link):
##               Estimate Std. Error z value Pr(>|z|)    
## (Intercept) -1.0881982  0.2620518  -4.153 3.29e-05 ***
## TEMPERATURE  0.0003469  0.0023677   0.147    0.884    
## 
## Phi coefficients (precision model with identity link):
##       Estimate Std. Error z value Pr(>|z|)  
## (phi)    9.305      4.505   2.066   0.0389 *
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 

Ở trên bạn có thể thấy TEMPERATUREhệ số là .0003469. Số mũ, exp (.0003469) = 1.000347

Cập nhật kết hợp trả lời và bình luận:

Bạn có thể thấy ở đây cách tăng nhiệt độ thêm 1 đơn vị từ -10 đến 10 tăng tỷ lệ

nd <- data.frame(TEMPERATURE = seq(-10, 10, by = 1))
nd$Proportion <- predict(b, newdata = nd)
nd$proportion_ratio <- nd$Proportion/(1 - nd$Proportion)
plot(Proportion ~ TEMPERATURE, data = nd, type = "b")

Giải thích là: Thay đổi 1 đơn vị TEMPERATUREdẫn đến thay đổi tương đối 1.000347 0,04% trong Proportion:

E(Proportion)1E(Proportion)

Từ khóa có sự thay đổi tương đối vì vậy khi bạn so sánh exp(coef(b))[2]với nd$proportion_ratio[2] / nd$proportion_ratio[1] bạn sẽ thấy chúng giống nhau

## ratio of proportion
nd$proportion_ratio[2] / nd$proportion_ratio[1] 
exp(coef(b))[2]
nd$proportion_ratio[-1] / nd$proportion_ratio[-20]

Nếu đúng Proportionnhư tên gọi của nó, thì nó rời rạc, không liên tục và hồi quy logistic có lẽ sẽ phù hợp hơn cho việc mô hình hóa nó.
Tim

Tim, tại sao? Tỷ lệ có thể là một tỷ lệ của hai nồng độ. Giá trị được báo cáo của người dùng theo tỷ lệ 1-100 (tỷ lệ 100%). Trong cả hai trường hợp tỷ lệ là liên tục. Trong trường hợp đầu tiên, nó dương (có thể> 1, tùy thuộc vào số được chia cho cái gì), trong trường hợp thứ hai, nó bị cắt ở 0 và 1.
Natalie

Câu trả lời:


10

Vâng, liên kết logit có thể được hiểu như thế. Đó không chỉ là sự thay đổi về "tỷ lệ cược" (= tỷ lệ xác suất) mà là sự thay đổi về tỷ lệ. Chính thức hơn, phương trình mô hình cho kỳ vọng giống như trong hồi quy logistic:

logit(μi)=xiβ
Ở đâu μi=E(yi). Đối với thiết lập của bạn, điều này có nghĩa là:
logit(E(Proportion))=1.31+0.004TemperatureE(Proportion)1E(Proportion)=exp(1.31+0.004Temperature)
Do đó, thay đổi 1 đơn vị tuyệt đối trong Temperature dẫn đến một sự thay đổi tương đối của exp(0.004)0.4% trong E(Proportion)/(1E(Proportion)).

Với một chút luyện tập, bạn có thể có được cảm giác hợp lý về điều này có nghĩa là gì trong thực tế dự kiến Proportion. Nếu bạn không có cảm giác đó (chưa), bạn có thể dễ dàng tính toán các tác động của những thay đổi trongTemperature, ví dụ,:

nd <- data.frame(TEMPERATURE = seq(-150, 150, by = 50))
nd$Proportion <- predict(b, newdata = nd)
print(nd)
plot(Proportion ~ TEMPERATURE, data = nd, type = "b")

để kiểm tra những thay đổi tuyệt đối trong Proportionnhững thay đổi tuyệt đối nhất định trong TEMPERATURE.


Cảm ơn bạn đã phản hồi của bạn. Để rõ ràng, 1,004 trong ví dụ của tôi có nghĩa là nhiệt độ tăng thêm 1 đơn vị dẫn đến tỷ lệ các loài được quan sát bởi máy BẤT K to tăng lên 4%? Khi bạn nói "Đó không phải là thay đổi về tỷ lệ cược mà là thay đổi tỷ lệ", có bất kỳ cách nào bạn có thể đăng bài toán mô tả điều đó hoặc có thể gọi dự đoán (b, newdata) theo cách thủ công để toán học về cách coefs của mô hình được chuyển đổi thành tỷ lệ? Tôi thấy rằng dự đoán đang lấy coefs và dữ liệu nhiệt độ mới và cho thấy mối quan hệ ngày càng tăng nhưng toán học vẫn còn mờ nhạt. Cám ơn bạn một lần nữa!
dùng3022875

Nó gần giống như trong trường hợp hồi quy logistic - xem phản hồi được cập nhật của tôi. Vì vậy, các tính toán về cơ bản là giống nhau nhưng kết quả không phải là xác suất mà là tỷ lệ. Tuy nhiên, lưu ý rằng đối với bản phân phối beta được mô hình hóa, có nhiều khía cạnh bạn có thể mô hình hóa hơn là chỉ mong đợi. Các predictphương pháp có thể cung cấp cho bạn dự kiến"response" μihoặc chỉ là bộ dự báo tuyến tính ( "link"), "precision"tham sốϕi, phương sai, lượng tử, v.v.
Achim Zeileis

Bạn có thể rõ ràng hơn? với exp (0,04) - tăng 1 đơn vị trong temp làm tăng tỷ lệ cược của những gì? bằng 0,04%? khán giả sẽ không hiểu sự gia tăng trong "E / 1-E"
user3022875

Khi bạn nói "Vì vậy, các tính toán về cơ bản là giống nhau nhưng kết quả không phải là xác suất mà là tỷ lệ." Là tỷ lệ bạn đang đề cập đến tỷ lệ ban đầu hoặc tỷ lệ của một tỷ lệ? Trong hồi quy logistic, tỷ lệ chênh lệch là tỷ lệ của tỷ lệ cược trong một danh mục không thuộc danh mục nhưng tỷ lệ chênh lệch có nghĩa là gì khi không có danh mục và ID là một số liên tục (0,1)? Bạn có thể đưa ra một cách giải thích về 0,04% không liên quan đến các công thức mà giáo dân sẽ hiểu không?
dùng3022875

Tỷ lệ là tỷ lệ ban đầu, ví dụ, trong GasolineYielddữ liệu yield = 0.5có nghĩa là tỷ lệ 50% dầu thô được chuyển đổi thành xăng. Điều này tương ứng với tỷ lệ 1 = 0,5 / 0,5, tức là, nhiều dầu thô được chuyển đổi thành không chuyển đổi. Nếu tỷ lệ này tăng 10% thì tỷ lệ mới là 1,1 tương ứng với tỷ lệ khoảng 0,5238. Do đó, các bước tính toán về cơ bản giống như trong mô hình logit. Re: giải thích cho giáo dân. Kinh nghiệm của tôi là tỷ lệ cược cũng rất khó hiểu ... do đó tôi sử dụng các hiệu ứng rất nhiều.
Achim Zeileis
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.