Tôi đã làm việc để trả lời câu hỏi của mình bằng cách tính toán tỷ lệ cược và tỷ lệ cược theo cách thủ công:
Acceptance blue red Grand Total
0 158 102 260
1 112 177 289
Total 270 279 549
Vì vậy, Tỷ lệ lẻ khi vào trường Red over Blue là:
O d d s A c c e p t I f R e dO d d s A c c c e p t I f B l u đ= =177/102112/158= 1.73530,7089= 2.448
Và đây là sự Backgroundredtrở lại của:
fit <- glm(Accepted~Background, data=dat, family="binomial")
exp(cbind(Odds_and_OR=coef(fit), confint(fit)))
Odds_and_OR 2.5 % 97.5 %
(Intercept) 0.7088608 0.5553459 0.9017961
Backgroundred 2.4480042 1.7397640 3.4595454
(Intercept)112 / 158 = 0,7089
Nếu thay vào đó, tôi chạy:
fit2 <- glm(Accepted~Background-1, data=dat, family="binomial")
exp(cbind(Odds=coef(fit2), confint(fit2)))
Odds 2.5 % 97.5 %
Backgroundblue 0.7088608 0.5553459 0.9017961
Backgroundred 1.7352941 1.3632702 2.2206569
Lợi nhuận chính xác là tỷ lệ nhận được 'màu xanh': Backgroundblue(0,7089) và tỷ lệ được chấp nhận là 'màu đỏ': Backgroundred(1.7353). Không có tỷ lệ lẻ ở đó. Do đó, hai giá trị trả về dự kiến sẽ không có đi có lại.
Cuối cùng, Làm thế nào để đọc kết quả nếu có 3 yếu tố trong hồi quy phân loại?
Cùng một hướng dẫn so với tính toán [R]:
Tôi đã tạo một bộ dữ liệu giả tưởng khác nhau có cùng tiền đề, nhưng lần này có ba nền dân tộc: "đỏ", "xanh" và "cam" và chạy cùng một chuỗi:
Đầu tiên, bảng dự phòng:
Acceptance blue orange red Total
0 86 65 130 281
1 64 42 162 268
Total 150 107 292 549
Và tính toán các tỷ lệ cược nhận được cho mỗi nhóm dân tộc:
- Tỷ lệ chấp nhận nếu màu đỏ = 1,246154;
- Tỷ lệ chấp nhận nếu màu xanh = 0,744186;
- Tỷ lệ chấp nhận nếu màu da cam = 0,646154
Cũng như các tỷ lệ cược khác nhau :
- HOẶC đỏ v xanh = 1.674519;
- HOẶC đỏ v cam = 1.928571;
- HOẶC xanh v đỏ = 0,597186;
- HOẶC màu xanh v cam = 1.151717;
- HOẶC cam v đỏ = 0,518519; và
- HOẶC màu cam v màu xanh = 0.868269
Và tiến hành hồi quy logistic thường quy theo sau là lũy thừa các hệ số:
fit <- glm(Accepted~Background, data=dat, family="binomial")
exp(cbind(ODDS=coef(fit), confint(fit)))
ODDS 2.5 % 97.5 %
(Intercept) 0.7441860 0.5367042 1.026588
Backgroundorange 0.8682692 0.5223358 1.437108
Backgroundred 1.6745192 1.1271430 2.497853
Mang lại tỷ lệ cược khi tham gia "blues" là (Intercept), và Tỷ lệ Odds của Orange so với Blue in Backgroundorangevà OR của Red v Blue trong Backgroundred.
Mặt khác, hồi quy mà không bị chặn có thể dự đoán chỉ trả về ba tỷ lệ cược độc lập :
fit2 <- glm(Accepted~Background-1, data=dat, family="binomial")
exp(cbind(ODDS=coef(fit2), confint(fit2)))
ODDS 2.5 % 97.5 %
Backgroundblue 0.7441860 0.5367042 1.0265875
Backgroundorange 0.6461538 0.4354366 0.9484999
Backgroundred 1.2461538 0.9900426 1.5715814
Rgọi một cách rõ ràng các hệ số (thông qua hàmcoef) mà bạn đang gọi là "tỷ lệ cược" trong đầu ra của bạn. Điều đó cho thấy bạn có thể muốn xem lại sự khác biệt giữa hai điều này.