Hiểu các dự đoán từ hồi quy logistic


13

Dự đoán của tôi đến từ mô hình hồi quy logistic (glm in R) không bị giới hạn giữa 0 và 1 như tôi mong đợi. Sự hiểu biết của tôi về hồi quy logistic là các tham số mô hình và đầu vào của bạn được kết hợp tuyến tính và phản hồi được chuyển thành xác suất bằng cách sử dụng chức năng liên kết logit. Vì hàm logit bị giới hạn trong khoảng từ 0 đến 1, tôi dự đoán các dự đoán của tôi sẽ bị giới hạn trong khoảng từ 0 đến 1.

Tuy nhiên đó không phải là những gì tôi thấy khi tôi thực hiện hồi quy logistic trong R:

data(iris)
iris.sub <- subset(iris, Species%in%c("versicolor","virginica"))
model    <- glm(Species ~ Sepal.Length + Sepal.Width, data = iris.sub, 
                family = binomial(link = "logit"))
hist(predict(model))

nhập mô tả hình ảnh ở đây

Nếu bất cứ điều gì đầu ra của dự đoán (mô hình) trông bình thường với tôi. Bất cứ ai có thể giải thích cho tôi tại sao các giá trị tôi nhận được không phải là xác suất?


3
Câu trả lời của Corone dưới đây bao gồm các chi tiết rất độc đáo. Hình gốc mà bạn có ở trên trình bày các giá trị tỷ lệ cược log trên trục x, có thể được chuyển đổi về mặt toán học thành xác suất (nghĩa là theo câu trả lời của Corone, bằng cách quay lại chức năng liên kết.)
James Stanley

Câu trả lời:


16

Các predict.glmphương pháp theo mặc định sẽ trả về dự đoán về quy mô của các dự đoán tuyến tính. Tức là họ chưa đi qua chức năng liên kết.

Thử

hist(predict(model, type = "response"))

thay thế

nhập mô tả hình ảnh ở đây


4
Bạn đã thực hiện một công việc tuyệt vời làm chủ khả năng đánh dấu và minh họa của chúng tôi trong một thời gian ngắn: câu trả lời này là một ví dụ hay về điều đó. Làm tốt!
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.