Tôi không chắc người mà bạn đã thực hiện có ý nghĩa gì với "Hồi quy logistic cho chúng ta mức độ liên kết" vì khi bạn nêu thử nghiệm chính xác của ngư dân làm điều gì đó khá giống nhau. Nhưng vẫn có một số khác biệt tôi có thể nghĩ ra.
1. Tỷ lệ cược (OR) có thể khác nhau
OR được báo cáo không phải giống nhau. Ít nhất điều này đúng với các hàm R fishing.test () và precision2x2 () so với hồi quy logistic thông qua hàm glm (). Dưới đây là một ví dụ:
# generating data
set.seed(1)
n <- 200
x <- rbinom(n, 1, .5)
y <- rbinom(n, 1, .4)
df <- data.frame(x, y)
# OR from logistic regression
exp(coef(glm(y ~ x,family=binomial(link='logit'),data= df)))[2]
1.423077
# OR from fisher's exact test
tab <- table(x, y)
fisher.test(tab)$estimate
1.420543 # the methods "minlike", "central" and "blaker" in the exact2x2 function result in the same OR
# calculating OR by hand
(tab[1,1]/ tab[2,1])/ (tab[1,2]/ tab[2,2])
1.423077
Kiểm tra chính xác OR của ngư dân khác với kiểm tra bằng tay hoặc được báo cáo trong hồi quy logistic vì chúng được tính theo Ước tính khả năng tối đa có điều kiện chứ không phải bằng MLE vô điều kiện (mẫu OR). Có thể có các tình huống trong đó các giá trị OR khác nhau nhiều hơn trong ví dụ của tôi. Và một lần nữa, OR khác nhau cho các chức năng được đề cập nhưng có thể có các biến thể khác của các thử nghiệm là chúng giống nhau.
2. giá trị p khác nhau
Tất nhiên các giá trị p khác nhau vì trong trường hợp hồi quy logistic, chúng được xác định bằng thống kê Wald và giá trị az trong khi có các loại thử nghiệm chính xác khác nhau thậm chí khác nhau về giá trị p (liên kết cuối cùng mở pdf). Xem ở đây để biết dữ liệu được sử dụng trước đây:
# p value from logistic regression
summary(glm(y ~ x,family=binomial(link='logit'),data= df))$coefficients["x", "Pr(>|z|)"]
0.2457947
# p value from fisher's exact test
library(exact2x2) # package covers different exact fisher's tests, see here https://cran.r-project.org/web/packages/exact2x2/index.html
exact2x2(tab,tsmethod="central")$p.value
0.3116818
exact2x2(tab,tsmethod="minlike")$p.value
0.290994 # which is same as fisher.test(tab)$p.value and exact2x2(tab,tsmethod="blaker")$p.value
Ở đây trong tất cả các trường hợp, người ta sẽ kết luận rằng không có ảnh hưởng đáng kể. Tuy nhiên, như bạn có thể thấy sự khác biệt không phải là nhỏ (.246 cho hồi quy logistic so với .291 hoặc thậm chí .312 cho thử nghiệm chính xác của ngư dân). Do đó, tùy thuộc vào việc bạn đang sử dụng hồi quy logistic hay kiểm tra chính xác của ngư dân, bạn có thể đi đến một kết luận khác hay không, có ảnh hưởng đáng kể hay không.
3. Dự đoán
Để thực hiện một sự tương tự: Tương quan Pearson và hồi quy tuyến tính khá giống nhau trong các trường hợp bivariate và hệ số hồi quy chuẩn hóa thậm chí giống như tương quan Pearson r. Nhưng bạn không thể đưa ra dự đoán với một mối tương quan vì nó thiếu một đánh chặn. Tương tự, ngay cả khi tỷ lệ chênh lệch của hồi quy logistic và kiểm tra chính xác của ngư dân là như nhau (không phải như trường hợp đã thảo luận ở điểm 1), bạn không thể đưa ra dự đoán với kết quả kiểm tra chính xác của ngư dân. Mặt khác, hồi quy logistic cung cấp cho bạn khả năng đánh chặn và (các) hệ số cần thiết để đưa ra dự đoán.
4. Hiệu suất
Sự khác biệt được đề cập trước đây có thể dẫn đến giả định rằng cần có sự khác biệt về hiệu suất của cả hai bài kiểm tra về sức mạnh và lỗi loại I. Có một số nguồn nói rằng thử nghiệm chính xác của ngư dân là quá bảo thủ. Mặt khác, người ta nên nhớ rằng các phân tích hồi quy logistic tiêu chuẩn là không có triệu chứng, do đó, với một vài quan sát, bạn có thể sẽ thích thử nghiệm chính xác của ngư dân .
Tóm lại , mặc dù cả hai thử nghiệm có thể được sử dụng cho cùng một dữ liệu, có một số khác biệt có thể dẫn đến các kết quả khác nhau và do đó dẫn đến các kết luận khác nhau. Vì vậy, tùy thuộc vào tình huống trong hai thử nghiệm bạn muốn sử dụng - trong trường hợp dự đoán, đó sẽ là hồi quy logistic, trong trường hợp cỡ mẫu nhỏ, thử nghiệm chính xác của ngư dân, v.v. Có lẽ còn nhiều sự khác biệt mà tôi đã bỏ qua nhưng có lẽ ai đó có thể chỉnh sửa và thêm chúng.