Tính tỷ lệ rủi ro bằng tỷ lệ chênh lệch từ hệ số hồi quy logistic


8

Tôi có một hồi quy logistic nhị phân chỉ với một yếu tố dự đoán yếu tố cố định nhị phân. Lý do tôi không làm điều đó như một phép thử Chi bình phương hoặc phép thử chính xác của Fisher là tôi cũng có một số yếu tố ngẫu nhiên (có nhiều điểm dữ liệu cho mỗi cá nhân và cá nhân nằm trong nhóm, mặc dù tôi không quan tâm đến hệ số hoặc ý nghĩa cho các biến ngẫu nhiên đó). Tôi làm điều này với R glmer.

Tôi muốn có thể biểu thị hệ số và khoảng tin cậy liên quan cho người dự đoán dưới dạng tỷ lệ rủi ro thay vì tỷ lệ chênh lệch. Điều này là do (có thể không dành cho bạn nhưng đối với khán giả của tôi) tỷ lệ rủi ro dễ hiểu hơn nhiều. Tỷ lệ rủi ro ở đây là sự gia tăng tương đối về cơ hội kết quả là 1 chứ không phải 0 nếu dự đoán là 1 chứ không phải 0.

Tỷ lệ cược là không đáng kể để có được từ hệ số và CI liên quan bằng cách sử dụng exp (). Để chuyển đổi tỷ lệ cược thành tỷ lệ rủi ro, bạn có thể sử dụng "RR = OR / (1 - p + (px OR)), trong đó p là rủi ro trong nhóm kiểm soát" (nguồn: http: //www.r- bloggers.com/how-to-convert-odds-ratios-to-relative-risks/). Nhưng, bạn cần có rủi ro trong nhóm kiểm soát, trong trường hợp của tôi có nghĩa là khả năng kết quả là 1 nếu dự đoán là 0. Tôi tin rằng hệ số chặn từ mô hình trên thực tế là tỷ lệ cược cho cơ hội này, vì vậy tôi có thể sử dụng thăm dò = tỷ lệ cược / (tỷ lệ cược + 1) để có được điều đó. Tôi gần như rất tốt về điều này theo như ước tính trung tâm cho tỷ lệ rủi ro. Nhưng điều làm tôi lo lắng là khoảng tin cậy liên quan, bởi vì hệ số chặn cũng có CI liên quan riêng. Tôi nên sử dụng ước tính trung tâm của đánh chặn, hay để thận trọng, tôi có nên sử dụng bất kỳ giới hạn nào của CI chặn để làm cho CI rủi ro tương đối của tôi rộng nhất? Hay tôi đang sủa sai cây hoàn toàn?


Bản sao có thể có của Hồi quy logistic trong R (Tỷ lệ lẻ)
Minnow

Đây không phải là một bản sao của câu hỏi đó. Tôi không có vấn đề gì về tỷ lệ cược, đó là tỷ lệ rủi ro mà tôi băn khoăn. Họ không được đề cập trong câu hỏi đó.
Amor chế tạo

Câu trả lời:


5

Zhang 1998 ban đầu trình bày một phương pháp tính toán các TCTD cho tỷ lệ rủi ro cho thấy bạn có thể sử dụng giới hạn dưới và trên của CI cho tỷ lệ chênh lệch.

Phương pháp này không hoạt động, nó thiên vị và thường tạo ra các ước tính chống ung thư (quá chặt chẽ) về tỷ lệ rủi ro 95% CI. Điều này là do mối tương quan giữa thuật ngữ chặn và thuật ngữ độ dốc khi bạn ám chỉ chính xác. Nếu tỷ lệ chênh lệch có xu hướng về giá trị thấp hơn của nó trong CI, thì thuật ngữ chặn sẽ tăng tỷ lệ phổ biến cao hơn ở những người có mức phơi nhiễm 0 và ngược lại với giá trị cao hơn trong CI. Mỗi trong số này tương ứng dẫn đến giới hạn thấp hơn và cao hơn cho CI.

Để trả lời câu hỏi của bạn hoàn toàn, bạn cần có kiến ​​thức về mức độ phổ biến cơ bản của kết quả để có được khoảng tin cậy chính xác. Dữ liệu từ các nghiên cứu kiểm soát trường hợp sẽ dựa vào dữ liệu khác để thông báo điều này.

Thay phiên, bạn có thể sử dụng phương thức delta nếu bạn có cấu trúc hiệp phương sai đầy đủ cho các ước tính tham số. Một tham số tương đương cho phép chuyển đổi OR thành RR (có phơi nhiễm nhị phân và một yếu tố dự đoán) là:

RR=1+exp(β0)1+exp(β0β1)

Và sử dụng phương pháp delta đa biến và định lý giới hạn trung tâm cho biết , bạn có thể có được phương sai của phân phối chuẩn gần đúng của . RRn([β^0,β^1][β0,β1])DN(0,I1(β))RR

Lưu ý, về mặt lý thuyết, điều này chỉ hoạt động đối với phơi nhiễm nhị phân và hồi quy logistic đơn biến. Có một số thủ thuật R đơn giản sử dụng phương pháp delta và tiêu chuẩn hóa biên cho các hiệp phương sai liên tục và các biến điều chỉnh khác. Nhưng để cho ngắn gọn tôi sẽ không thảo luận về điều đó ở đây.

Tuy nhiên, có một số cách để tính toán rủi ro tương đối và lỗi tiêu chuẩn của nó trực tiếp từ các mô hình trong R. Hai ví dụ về điều này dưới đây:

x <- sample(0:1, 100, replace=T)
y <- rbinom(100, 1, x*.2+.2)
glm(y ~ x, family=binomial(link=log))
library(survival)
coxph(Surv(time=rep(1,100), event=y) ~ x)

http://research.labiomed.org/Biuler/Education/Case%20Studies%202005/Session4/ZhangYu.pdf


0

AdamO (hoặc bất cứ ai!), Bạn có thể giúp tôi không? Tôi đã tạo ví dụ tái tạo này dựa trên mã của AdamO:

 set.seed(12345)
 group <- sample(0:1, 100, replace=T)

 set.seed(9485735)
 y <- rbinom(100, 1, x*.2+.2)

 group[group == 0] <- "A"
 group[group == 1] <- "B"

 table(y, group)
   group
y    A  B
  0 31 38
  1 17 14

 (14/38) / (17/31)           # Odds ratio (group B relative to A)
[1] 0.6718266



 lr <- glm(y ~ group, family=binomial(link=logit)) 
 exp(lr$coefficients)
(Intercept)      groupB 
  0.5483871   0.6718266 

Ví dụ này cho thấy tỷ lệ chênh lệch được tính toán từ hồi quy logistic không khớp với tỷ lệ chênh lệch được tính bằng tay. Tuy nhiên, rủi ro tương đối được tính toán theo mô hình Cox không khớp với rủi ro tương đối được tính bằng tay.

      (14/(14+38)) / (17/(17+31)) # Relative risk (group B relative to A)
[1] 0.760181

library(survival)
 coxph(Surv(time=rep(1,100), event=y) ~ group)

Call:
coxph(formula = Surv(time = rep(1, 100), event = y) ~ group)

         coef exp(coef) se(coef)    z    p
groupB -0.326     0.722    0.361 -0.9 0.37

Likelihood ratio test=0.82  on 1 df, p=0.364
n= 100, number of events= 31 

Tôi đã bỏ lỡ một cái gì đó?


Bạn đang hỏi một câu hỏi nhiều hơn là trả lời một.
Michael R. Chernick

Bạn nói đúng Michael. Vấn đề là trường bình luận không cho phép đăng một bài có cấu trúc như thế này.
Luc
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.