Liệu nó có ý nghĩa để sử dụng hồi quy Logistic với kết quả nhị phân và dự đoán?


18

Tôi có một biến kết quả nhị phân {0,1} và biến dự đoán {0,1}. Suy nghĩ của tôi là không có ý nghĩa để làm logistic trừ khi tôi bao gồm các biến khác và tính tỷ lệ cược.

Với một công cụ dự đoán nhị phân, sẽ không tính toán tỷ lệ đủ xác suất so với tỷ lệ cược?

Câu trả lời:


26

Trong trường hợp này, bạn có thể thu gọn dữ liệu của mình thành trong đó S i j là số trường hợp cho x = iy = j với i , j { 0 , 1 } . Giả sử có n quan sát tổng thể.

XY010S00S011S10S11
Sijx=iy=ji,j{0,1}n

Nếu chúng ta phù hợp với mô hình (trong đó g là chức năng liên kết của chúng tôi) chúng tôi sẽ thấy rằng β 0 là các logit của tỷ lệ thành công khi x i = 0beta 0 + β 1 là logit của tỷ lệ thành công khipi=g1(xiTβ)=g1(β0+β11xi=1)gβ^0xi=0β^0+β^1 . Nói cách khác, β 0 = g ( S 01xi=1 β 0+ β 1=g(S11

β^0=g(S01S00+S01)
β^0+β^1=g(S11S10+S11).

Hãy kiểm tra xem đây là R.

n <- 54
set.seed(123)
x <- rbinom(n, 1, .4)
y <- rbinom(n, 1, .6)

tbl <- table(x=x,y=y)

mod <- glm(y ~ x, family=binomial())

# all the same at 0.5757576
binomial()$linkinv( mod$coef[1])
mean(y[x == 0])
tbl[1,2] / sum(tbl[1,])

# all the same at 0.5714286
binomial()$linkinv( mod$coef[1] + mod$coef[2])
mean(y[x == 1])
tbl[2,2] / sum(tbl[2,])

Vì vậy, các hệ số hồi quy logistic là các phép biến đổi chính xác của tỷ lệ đến từ bảng.

Kết quả cuối cùng là chúng ta chắc chắn có thể phân tích tập dữ liệu này bằng hồi quy logistic nếu chúng ta có dữ liệu đến từ một loạt các biến ngẫu nhiên Bernoulli, nhưng hóa ra không khác gì phân tích trực tiếp bảng dự phòng kết quả.


Yi|xiBern(pi)xipi=g1(β0+β1xi)xipip0p1

i:xi=0Yi=S01Bin(n0,p0)
i:xi=1Yi=S11Bin(n1,p1).
xin0n1

S01/n0=S01S00+S01pp0 and S11/n1=S11S10+S11pp1.

Yi|xi=jBern(pj)Sj1Bin(nj,pj)


1

Khi bạn có nhiều hơn một yếu tố dự đoán và tất cả các yếu tố dự đoán là biến nhị phân, bạn có thể điều chỉnh mô hình bằng cách sử dụng hồi quy logic [1] (lưu ý đó là "Logic" chứ không phải "Logistic"). Nó hữu ích khi bạn tin rằng hiệu ứng tương tác giữa các yếu tố dự đoán của bạn là nổi bật. Có một triển khai trong R (LogicReg gói).

[1] Ruczinski, I., Kooperberg, C., & LeBlanc, M. (2003). Hồi quy logic. Tạp chí thống kê tính toán và đồ họa, 12 (3), 475-511.


1
Câu hỏi cụ thể là về một biến hồi quy, do đó câu trả lời của bạn sẽ phục vụ tốt hơn như là một nhận xét.
Richard Hardy
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.