Tôi đã làm việc để trả lời câu hỏi của mình bằng cách tính toán tỷ lệ cược và tỷ lệ cược theo cách thủ công:
Acceptance blue red Grand Total
0 158 102 260
1 112 177 289
Total 270 279 549
Vì vậy, Tỷ lệ lẻ khi vào trường Red over Blue là:
O d d s A c c e p t I f R e dO d d s A c c c e p t I f B l u đ= =177/102112/158= 1.73530,7089= 2.448
Và đây là sự Backgroundred
trở lại của:
fit <- glm(Accepted~Background, data=dat, family="binomial")
exp(cbind(Odds_and_OR=coef(fit), confint(fit)))
Odds_and_OR 2.5 % 97.5 %
(Intercept) 0.7088608 0.5553459 0.9017961
Backgroundred 2.4480042 1.7397640 3.4595454
(Intercept)
112 / 158 = 0,7089
Nếu thay vào đó, tôi chạy:
fit2 <- glm(Accepted~Background-1, data=dat, family="binomial")
exp(cbind(Odds=coef(fit2), confint(fit2)))
Odds 2.5 % 97.5 %
Backgroundblue 0.7088608 0.5553459 0.9017961
Backgroundred 1.7352941 1.3632702 2.2206569
Lợi nhuận chính xác là tỷ lệ nhận được 'màu xanh': Backgroundblue
(0,7089) và tỷ lệ được chấp nhận là 'màu đỏ': Backgroundred
(1.7353). Không có tỷ lệ lẻ ở đó. Do đó, hai giá trị trả về dự kiến sẽ không có đi có lại.
Cuối cùng, Làm thế nào để đọc kết quả nếu có 3 yếu tố trong hồi quy phân loại?
Cùng một hướng dẫn so với tính toán [R]:
Tôi đã tạo một bộ dữ liệu giả tưởng khác nhau có cùng tiền đề, nhưng lần này có ba nền dân tộc: "đỏ", "xanh" và "cam" và chạy cùng một chuỗi:
Đầu tiên, bảng dự phòng:
Acceptance blue orange red Total
0 86 65 130 281
1 64 42 162 268
Total 150 107 292 549
Và tính toán các tỷ lệ cược nhận được cho mỗi nhóm dân tộc:
- Tỷ lệ chấp nhận nếu màu đỏ = 1,246154;
- Tỷ lệ chấp nhận nếu màu xanh = 0,744186;
- Tỷ lệ chấp nhận nếu màu da cam = 0,646154
Cũng như các tỷ lệ cược khác nhau :
- HOẶC đỏ v xanh = 1.674519;
- HOẶC đỏ v cam = 1.928571;
- HOẶC xanh v đỏ = 0,597186;
- HOẶC màu xanh v cam = 1.151717;
- HOẶC cam v đỏ = 0,518519; và
- HOẶC màu cam v màu xanh = 0.868269
Và tiến hành hồi quy logistic thường quy theo sau là lũy thừa các hệ số:
fit <- glm(Accepted~Background, data=dat, family="binomial")
exp(cbind(ODDS=coef(fit), confint(fit)))
ODDS 2.5 % 97.5 %
(Intercept) 0.7441860 0.5367042 1.026588
Backgroundorange 0.8682692 0.5223358 1.437108
Backgroundred 1.6745192 1.1271430 2.497853
Mang lại tỷ lệ cược khi tham gia "blues" là (Intercept)
, và Tỷ lệ Odds của Orange so với Blue in Backgroundorange
và OR của Red v Blue trong Backgroundred
.
Mặt khác, hồi quy mà không bị chặn có thể dự đoán chỉ trả về ba tỷ lệ cược độc lập :
fit2 <- glm(Accepted~Background-1, data=dat, family="binomial")
exp(cbind(ODDS=coef(fit2), confint(fit2)))
ODDS 2.5 % 97.5 %
Backgroundblue 0.7441860 0.5367042 1.0265875
Backgroundorange 0.6461538 0.4354366 0.9484999
Backgroundred 1.2461538 0.9900426 1.5715814
R
gọi một cách rõ ràng các hệ số (thông qua hàmcoef
) mà bạn đang gọi là "tỷ lệ cược" trong đầu ra của bạn. Điều đó cho thấy bạn có thể muốn xem lại sự khác biệt giữa hai điều này.