Thử nghiệm chính xác của Fisher là gì?


11

Trong công việc của tôi, tôi đã thấy một số cách sử dụng thử nghiệm chính xác của Fisher và tôi đã tự hỏi làm thế nào nó phù hợp với dữ liệu của tôi. Nhìn vào một số nguồn tôi đã hiểu làm thế nào để tính toán thống kê, nhưng không bao giờ thấy một lời giải thích rõ ràng và chính thức về giả thuyết null giả định.

Ai đó có thể vui lòng giải thích hoặc giới thiệu cho tôi một lời giải thích chính thức về phân phối giả định? Sẽ biết ơn về một lời giải thích về các giá trị trong bảng dự phòng.


3
Trong trường hợp 2x2, nó dựa trên phân phối siêu bội.
Glen_b -Reinstate Monica

Câu trả lời:


11

Trong trường hợp , giả định phân phối được đưa ra bởi hai biến ngẫu nhiên nhị thức độc lập và . Giả thuyết là sự bình đẳng . Nhưng thử nghiệm chính xác của Fisher là một thử nghiệm có điều kiện: nó dựa vào phân phối có điều kiện của được đưa ra . Phân phối này là phân phối siêu bội với một tham số chưa biết: tỷ lệ chênh lệch , và sau đó giả thuyết khống là .2×2X1Bin(n1,θ1)X2Bin(n2,θ2)θ1=θ2X1X1+X2ψ=θ11θ1θ21θ2ψ=1

Phân phối này có trang Wikipedia của nó .

Để đánh giá nó với R, bạn chỉ cần sử dụng công thức xác định xác suất có điều kiện:

p1 <- 7/27
p2 <- 14/70
x1 <- 7; n1 <- 27
x2 <- 14; n2 <- 56
# 
m <- x1+x2
dbinom(x1, n1, p1)*dbinom(x2, n2, p2)/sum(dbinom(0:m, n1, p1)*dbinom(m-(0:m), n2, p2))
[1] 0.1818838

Hoặc sử dụng dnoncenhypergeomchức năng của MCMCpackgói:

psi <- p1/(1-p1)/(p2/(1-p2)) # this is the odds ratio
MCMCpack::dnoncenhypergeom(x=x1, n1, n2, x1+x2, psi)
[1] 0.1818838

Cảm ơn bạn @Stephane. Bạn có thể giải thích thêm tại sao nó trở thành siêu bội, và các tham số là gì?
Amit Lavon

2
Xin lỗi @AmitLavon, tôi không biết chi tiết về phân phối siêu bội này.
Stéphane Laurent

1
@AmitLavon Tôi vừa chỉnh sửa câu trả lời của mình để bao gồm liên kết đến wikipedia và mã R.
Stéphane Laurent

10

Thử nghiệm được gọi là "chính xác" của Fisher đưa ra cùng một loại giả định tinh tế mà thử nghiệm đưa ra.χ2

  • Hai biến được đánh giá cho sự liên kết là các biến thực sự đa biến hoặc không có gì khác nhau, chẳng hạn như Hoa Kỳ / Châu Âu còn sống / còn sống. Nếu một hoặc cả hai biến là đơn giản hóa tính liên tục cơ bản, thì không nên thực hiện phân tích dữ liệu phân loại.
  • Không có biến nền liên quan khác. Nếu là biến kết quả và là biến được đánh giá để liên kết với , thì xác suất giống hệt nhau cho mọi đối tượng có cố định tại . Bảng ngẫu nhiên giả định có hiệu lực mà không có sự không đồng nhất trong việc phân phối của mà không được chiếm bởi . Ví dụ, trong một thử nghiệm lâm sàng ngẫu nhiên nghiên cứu ảnh hưởng của điều trị A so với B đến xác suất tử vong,X Y Y = y X x Y X 2 × 2YXYY=yXxYX2×2xét nghiệm bảng dự phòng giả định rằng mọi đối tượng điều trị A đều có xác suất tử vong như nhau. [Người ta có thể lập luận rằng đây là một giả định quá nghiêm ngặt, nhưng vị trí đó không nhận ra sự mất quyền lực khi thực hiện các thử nghiệm liên kết không được điều chỉnh.]

Thử nghiệm của Fisher đưa ra một giả định không được thực hiện bằng các thử nghiệm liên kết vô điều kiện như thử nghiệm của Pearson : chúng tôi quan tâm đến phân phối biên "hiện tại" của cả và , nghĩa là chúng tôi đang điều chỉnh tần số của loại kết quả. Điều này là không hợp lý cho các nghiên cứu trong tương lai. Việc sử dụng thử nghiệm của Fisher dẫn đến chủ nghĩa bảo thủ. Giá trị của nó ở mức trung bình quá lớn, vì thử nghiệm đảm bảo rằng giá trị không quá nhỏ. Trung bình, Pearson xác hơn so với Fisher, ngay cả với tần số dự kiến ​​thấp hơn 5 trong một số tế bào. X Y Y P P χ 2 Pχ2XYYPPχ2 P


Cảm ơn bạn @FrankHarrell. Bạn có thể cung cấp tài liệu tham khảo cho khiếu nại của mình về giá trị P vuông góc chính xác hơn so với Fisher không?
Amit Lavon

1
Xem ví dụ citeulike.org/user/harrelfe/tag/fishers-exact-test . Điều này đã được thảo luận ở độ dài trên stackexchange.
Frank Harrell

đáng buồn là ctiteulike đã biến mất và web.archive.org dường như chỉ thu thập dữ liệu trang đầu tiên của tài khoản harrelfe.
Glen_b -Reinstate Monica

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.