Tôi biết tôi đang thiếu một cái gì đó trong sự hiểu biết của tôi về hồi quy logistic, và sẽ thực sự đánh giá cao bất kỳ sự giúp đỡ nào.
Theo như tôi hiểu, hồi quy logistic giả định rằng xác suất của kết quả '1' được đưa ra cho các đầu vào, là sự kết hợp tuyến tính của các đầu vào, được truyền qua hàm logistic nghịch đảo. Điều này được minh họa trong mã R sau:
#create data:
x1 = rnorm(1000) # some continuous variables
x2 = rnorm(1000)
z = 1 + 2*x1 + 3*x2 # linear combination with a bias
pr = 1/(1+exp(-z)) # pass through an inv-logit function
y = pr > 0.5 # take as '1' if probability > 0.5
#now feed it to glm:
df = data.frame(y=y,x1=x1,x2=x2)
glm =glm( y~x1+x2,data=df,family="binomial")
và tôi nhận được thông báo lỗi sau:
Thông báo cảnh báo: 1: glm.fit: thuật toán không hội tụ 2: glm.fit: xác suất được trang bị bằng số 0 hoặc 1 xảy ra
Tôi đã làm việc với R một thời gian rồi; đủ để biết rằng có lẽ tôi là người đáng trách .. chuyện gì đang xảy ra ở đây vậy?