Phần chênh lệch sử dụng thử nghiệm chính xác của Fisher vs một Logistic Regression cho là gì


10

Đối với bảng , hai cách để suy luận trên bảng là thông qua Kiểm tra chính xác của Fisher và cũng là hồi quy logistic.2×2

Tôi được cho biết rằng bằng cách sử dụng Thử nghiệm chính xác của Fisher, chúng tôi chỉ quan tâm đến sự hiện diện của hiệp hội. Nhưng với Hồi quy Logistic, chúng tôi quan tâm đến mức độ liên kết.

Tuy nhiên, tôi không hiểu tại sao. Ví dụ, trong thử nghiệm chính xác của Fisher được thực hiện ở R, nó trả về Tỷ lệ lẻ với Khoảng tin cậy, trong khi với Hồi quy logistic, chúng tôi được trả về với phần chặn và độ dốc, cả hai đều tương ứng với tỷ lệ cược log và tỷ lệ cược log tỉ lệ.

Câu hỏi của tôi là , hồi quy logistic cho chúng ta mức độ liên kết ở đâu? Tôi giả sử nó ở hệ số , nhưng đó chỉ là tỷ lệ chênh lệch log, mà thử nghiệm chính xác của Fisher cũng mang lại . Sự khác biệt là gì?β1

Câu trả lời:


2

Tôi không chắc người mà bạn đã thực hiện có ý nghĩa gì với "Hồi quy logistic cho chúng ta mức độ liên kết" vì khi bạn nêu thử nghiệm chính xác của ngư dân làm điều gì đó khá giống nhau. Nhưng vẫn có một số khác biệt tôi có thể nghĩ ra.

1. Tỷ lệ cược (OR) có thể khác nhau

OR được báo cáo không phải giống nhau. Ít nhất điều này đúng với các hàm R fishing.test () và precision2x2 () so với hồi quy logistic thông qua hàm glm (). Dưới đây là một ví dụ:

# generating data
set.seed(1)
n <- 200
x <- rbinom(n, 1, .5)
y <- rbinom(n, 1, .4)
df <- data.frame(x, y)

# OR from logistic regression
exp(coef(glm(y ~ x,family=binomial(link='logit'),data= df)))[2]
1.423077

# OR from fisher's exact test
tab <- table(x, y)
fisher.test(tab)$estimate
1.420543 # the methods "minlike", "central" and "blaker" in the exact2x2 function result in the same OR

# calculating OR by hand
(tab[1,1]/ tab[2,1])/ (tab[1,2]/ tab[2,2])
1.423077

Kiểm tra chính xác OR của ngư dân khác với kiểm tra bằng tay hoặc được báo cáo trong hồi quy logistic vì chúng được tính theo Ước tính khả năng tối đa có điều kiện chứ không phải bằng MLE vô điều kiện (mẫu OR). Có thể có các tình huống trong đó các giá trị OR khác nhau nhiều hơn trong ví dụ của tôi. Và một lần nữa, OR khác nhau cho các chức năng được đề cập nhưng có thể có các biến thể khác của các thử nghiệm là chúng giống nhau.

2. giá trị p khác nhau

Tất nhiên các giá trị p khác nhau vì trong trường hợp hồi quy logistic, chúng được xác định bằng thống kê Wald và giá trị az trong khi có các loại thử nghiệm chính xác khác nhau thậm chí khác nhau về giá trị p (liên kết cuối cùng mở pdf). Xem ở đây để biết dữ liệu được sử dụng trước đây:

# p value from logistic regression
summary(glm(y ~ x,family=binomial(link='logit'),data= df))$coefficients["x", "Pr(>|z|)"]
0.2457947

# p value from fisher's exact test
library(exact2x2) # package covers different exact fisher's tests, see here https://cran.r-project.org/web/packages/exact2x2/index.html

exact2x2(tab,tsmethod="central")$p.value
0.3116818
exact2x2(tab,tsmethod="minlike")$p.value
0.290994 # which is same as fisher.test(tab)$p.value and exact2x2(tab,tsmethod="blaker")$p.value

Ở đây trong tất cả các trường hợp, người ta sẽ kết luận rằng không có ảnh hưởng đáng kể. Tuy nhiên, như bạn có thể thấy sự khác biệt không phải là nhỏ (.246 cho hồi quy logistic so với .291 hoặc thậm chí .312 cho thử nghiệm chính xác của ngư dân). Do đó, tùy thuộc vào việc bạn đang sử dụng hồi quy logistic hay kiểm tra chính xác của ngư dân, bạn có thể đi đến một kết luận khác hay không, có ảnh hưởng đáng kể hay không.

3. Dự đoán

Để thực hiện một sự tương tự: Tương quan Pearson và hồi quy tuyến tính khá giống nhau trong các trường hợp bivariate và hệ số hồi quy chuẩn hóa thậm chí giống như tương quan Pearson r. Nhưng bạn không thể đưa ra dự đoán với một mối tương quan vì nó thiếu một đánh chặn. Tương tự, ngay cả khi tỷ lệ chênh lệch của hồi quy logistic và kiểm tra chính xác của ngư dân là như nhau (không phải như trường hợp đã thảo luận ở điểm 1), bạn không thể đưa ra dự đoán với kết quả kiểm tra chính xác của ngư dân. Mặt khác, hồi quy logistic cung cấp cho bạn khả năng đánh chặn và (các) hệ số cần thiết để đưa ra dự đoán.

4. Hiệu suất

Sự khác biệt được đề cập trước đây có thể dẫn đến giả định rằng cần có sự khác biệt về hiệu suất của cả hai bài kiểm tra về sức mạnh và lỗi loại I. Có một số nguồn nói rằng thử nghiệm chính xác của ngư dân là quá bảo thủ. Mặt khác, người ta nên nhớ rằng các phân tích hồi quy logistic tiêu chuẩn là không có triệu chứng, do đó, với một vài quan sát, bạn có thể sẽ thích thử nghiệm chính xác của ngư dân .

Tóm lại , mặc dù cả hai thử nghiệm có thể được sử dụng cho cùng một dữ liệu, có một số khác biệt có thể dẫn đến các kết quả khác nhau và do đó dẫn đến các kết luận khác nhau. Vì vậy, tùy thuộc vào tình huống trong hai thử nghiệm bạn muốn sử dụng - trong trường hợp dự đoán, đó sẽ là hồi quy logistic, trong trường hợp cỡ mẫu nhỏ, thử nghiệm chính xác của ngư dân, v.v. Có lẽ còn nhiều sự khác biệt mà tôi đã bỏ qua nhưng có lẽ ai đó có thể chỉnh sửa và thêm chúng.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.