(Để làm cho các khái niệm của chúng ta chính xác hơn một chút, hãy gọi 'thống kê kiểm tra' là phân phối của thứ mà chúng ta tìm kiếm để thực sự tính giá trị p. Điều này có nghĩa là đối với phép thử hai đầu, thống kê kiểm tra của chúng ta sẽ là chứ không phải )|T|T
Những gì một thống kê kiểm tra thực hiện là tạo ra một thứ tự trên không gian mẫu (hoặc nghiêm ngặt hơn, một thứ tự từng phần), để bạn có thể xác định các trường hợp cực đoan (những trường hợp phù hợp nhất với phương án).
Trong trường hợp thử nghiệm chính xác của Fisher, đã có một thứ tự theo nghĩa - đó là xác suất của các bảng 2x2 khác nhau. Khi điều đó xảy ra, chúng tương ứng với thứ tự trên theo nghĩa là các giá trị lớn nhất hoặc nhỏ nhất của là 'cực trị' và chúng cũng là những giá trị có xác suất nhỏ nhất. Vì vậy, thay vì nhìn vào các giá trị của theo cách bạn đề xuất, người ta có thể chỉ cần làm việc từ đầu lớn và nhỏ, ở mỗi bước chỉ cần thêm giá trị nào ( lớn nhất hoặc nhỏ nhấtX1,1X1,1 X 1 , 1 X 1 , 1X1,1X1,1-giá trị chưa có trong đó) có xác suất nhỏ nhất liên quan đến nó, tiếp tục cho đến khi bạn đạt được bảng quan sát của mình; trên sự bao gồm của nó, tổng xác suất của tất cả các bảng cực trị đó là giá trị p.
Đây là một ví dụ:
> data.frame(x=x,prob=dhyper(x,9,12,10),rank=rank(dhyper(x,9,12,10)))
x prob rank
1 0 1.871194e-04 2
2 1 5.613581e-03 4
3 2 5.052223e-02 6
4 3 1.886163e-01 8
5 4 3.300786e-01 10
6 5 2.829245e-01 9
7 6 1.178852e-01 7
8 7 2.245433e-02 5
9 8 1.684074e-03 3
10 9 3.402171e-05 1
Cột đầu tiên là các giá trị , cột thứ hai là xác suất và cột thứ ba là thứ tự cảm ứng.X1,1
Vì vậy, trong trường hợp cụ thể của phép thử chính xác Fisher, xác suất của mỗi bảng (tương đương, của mỗi giá trị ) có thể được coi là thống kê thử nghiệm thực tếX1,1 .
Nếu bạn so sánh thống kê kiểm tra được đề xuất của mình, nó tạo ra thứ tự tương tự trong trường hợp này (và tôi tin rằng nó nói chung nhưng tôi chưa kiểm tra), trong đó các giá trị lớn hơn của thống kê đó là các giá trị nhỏ hơn của xác suất, do đó, nó có thể được coi là 'thống kê' - nhưng nhiều đại lượng khác cũng vậy - thực sự là bất kỳ số lượng nào bảo toàn thứ tự này của trong mọi trường hợp đều là thống kê kiểm tra tương đương, bởi vì chúng luôn tạo ra các giá trị p giống hệt nhau.|X1,1−μ|X 1 , 1X1,1
Cũng lưu ý rằng với khái niệm chính xác hơn về 'thống kê kiểm tra' được giới thiệu khi bắt đầu, không có thống kê kiểm tra khả thi nào cho vấn đề này thực sự có phân phối siêu bội; thực hiện, nhưng thực tế nó không phải là một thống kê kiểm tra phù hợp cho thử nghiệm hai đuôi (nếu chúng tôi đã thực hiện thử nghiệm một phía trong đó chỉ liên kết nhiều hơn trong đường chéo chính và không theo đường chéo thứ hai được coi là phù hợp với thay thế, sau đó nó sẽ là một thống kê thử nghiệm). Đây chỉ là vấn đề một đuôi / hai đuôi giống như tôi đã bắt đầu.X1,1
[Chỉnh sửa: một số chương trình trình bày một thống kê kiểm tra cho bài kiểm tra Fisher; Tôi cho rằng đây sẽ là phép tính loại -2logL có thể so sánh một cách không có triệu chứng với bình phương. Một số cũng có thể trình bày tỷ lệ cược hoặc nhật ký của nó nhưng điều đó không hoàn toàn tương đương.]