Thống kê kiểm tra trong bài kiểm tra chính xác của Fisher là gì?


9

Đối với bảng dự phòng 2 trên 2, một số người cho biết thử nghiệm chính xác của Fisher sử dụng số trong ô (1,1) trong bảng làm thống kê kiểm tra và theo giả thuyết null, sẽ có phân phối siêu bội. X 1 , 1X1,1X1,1

Một số người cho biết thống kê kiểm tra của nó là trong đó là giá trị trung bình của phân bố siêu bội (đã đề cập ở trên) dưới null. Nó cũng nói rằng giá trị p được xác định dựa trên bảng phân phối siêu âm. Tôi đã tự hỏi nếu có một số lý do để trừ trung bình và sau đó để có giá trị tuyệt đối? không có phân phối siêu bội dưới null, phải không?μ | X 1 , 1 - L |

|X1,1μ|
μ|X1,1μ|

Câu trả lời:


10

(Để làm cho các khái niệm của chúng ta chính xác hơn một chút, hãy gọi 'thống kê kiểm tra' là phân phối của thứ mà chúng ta tìm kiếm để thực sự tính giá trị p. Điều này có nghĩa là đối với phép thử hai đầu, thống kê kiểm tra của chúng ta sẽ là chứ không phải )|T|T

Những gì một thống kê kiểm tra thực hiện là tạo ra một thứ tự trên không gian mẫu (hoặc nghiêm ngặt hơn, một thứ tự từng phần), để bạn có thể xác định các trường hợp cực đoan (những trường hợp phù hợp nhất với phương án).

Trong trường hợp thử nghiệm chính xác của Fisher, đã có một thứ tự theo nghĩa - đó là xác suất của các bảng 2x2 khác nhau. Khi điều đó xảy ra, chúng tương ứng với thứ tự trên theo nghĩa là các giá trị lớn nhất hoặc nhỏ nhất của là 'cực trị' và chúng cũng là những giá trị có xác suất nhỏ nhất. Vì vậy, thay vì nhìn vào các giá trị của theo cách bạn đề xuất, người ta có thể chỉ cần làm việc từ đầu lớn và nhỏ, ở mỗi bước chỉ cần thêm giá trị nào ( lớn nhất hoặc nhỏ nhấtX1,1X1,1 X 1 , 1 X 1 , 1X1,1X1,1-giá trị chưa có trong đó) có xác suất nhỏ nhất liên quan đến nó, tiếp tục cho đến khi bạn đạt được bảng quan sát của mình; trên sự bao gồm của nó, tổng xác suất của tất cả các bảng cực trị đó là giá trị p.

Đây là một ví dụ:

hàm xác suất siêu bội

> data.frame(x=x,prob=dhyper(x,9,12,10),rank=rank(dhyper(x,9,12,10)))
   x         prob rank
1  0 1.871194e-04    2
2  1 5.613581e-03    4
3  2 5.052223e-02    6
4  3 1.886163e-01    8
5  4 3.300786e-01   10
6  5 2.829245e-01    9
7  6 1.178852e-01    7
8  7 2.245433e-02    5
9  8 1.684074e-03    3
10 9 3.402171e-05    1

Cột đầu tiên là các giá trị , cột thứ hai là xác suất và cột thứ ba là thứ tự cảm ứng.X1,1

Vì vậy, trong trường hợp cụ thể của phép thử chính xác Fisher, xác suất của mỗi bảng (tương đương, của mỗi giá trị ) có thể được coi là thống kê thử nghiệm thực tếX1,1 .

Nếu bạn so sánh thống kê kiểm tra được đề xuất của mình, nó tạo ra thứ tự tương tự trong trường hợp này (và tôi tin rằng nó nói chung nhưng tôi chưa kiểm tra), trong đó các giá trị lớn hơn của thống kê đó là các giá trị nhỏ hơn của xác suất, do đó, nó có thể được coi là 'thống kê' - nhưng nhiều đại lượng khác cũng vậy - thực sự là bất kỳ số lượng nào bảo toàn thứ tự này của trong mọi trường hợp đều là thống kê kiểm tra tương đương, bởi vì chúng luôn tạo ra các giá trị p giống hệt nhau.|X1,1μ|X 1 , 1X1,1

Cũng lưu ý rằng với khái niệm chính xác hơn về 'thống kê kiểm tra' được giới thiệu khi bắt đầu, không có thống kê kiểm tra khả thi nào cho vấn đề này thực sự có phân phối siêu bội; thực hiện, nhưng thực tế nó không phải là một thống kê kiểm tra phù hợp cho thử nghiệm hai đuôi (nếu chúng tôi đã thực hiện thử nghiệm một phía trong đó chỉ liên kết nhiều hơn trong đường chéo chính và không theo đường chéo thứ hai được coi là phù hợp với thay thế, sau đó nó sẽ là một thống kê thử nghiệm). Đây chỉ là vấn đề một đuôi / hai đuôi giống như tôi đã bắt đầu.X1,1

[Chỉnh sửa: một số chương trình trình bày một thống kê kiểm tra cho bài kiểm tra Fisher; Tôi cho rằng đây sẽ là phép tính loại -2logL có thể so sánh một cách không có triệu chứng với bình phương. Một số cũng có thể trình bày tỷ lệ cược hoặc nhật ký của nó nhưng điều đó không hoàn toàn tương đương.]


Cảm ơn, Glen_b! phân phối của dưới null là phân phối siêu bội, không đối xứng với giá trị trung bình của nó . Vì vậy, tôi đã tự hỏi nếulà một thống kê kiểm tra hợp lý? L | X 1 , 1 - L |X1,1μ|X1,1μ|
Tim

Có vẻ như một thống kê kiểm tra cực kỳ hợp lý, vì nó hoàn toàn có thể hiểu và dễ hiểu. Thật vậy, không có thống kê nào có thể có phân phối đối xứng. Chúng ta hãy quên các chi tiết cụ thể của thử nghiệm Fisher trong giây lát - nếu thống kê đó có ý nghĩa đối với bạn, bạn có thể tính toán một thử nghiệm chính xác trên cơ sở đó (sử dụng các phép tính siêu bội để tìm xác suất). Nếu bạn muốn chứng minh rằng họ đang tạo ra cùng một thứ tự trong mọi trường hợp, đó có lẽ là một câu hỏi mới.
Glen_b -Reinstate Monica

6

μ | X 1 , 1 - L | X 1 , 1|X1,1μ|không thể có phân phối siêu bội nói chung vì không cần phải là giá trị nguyên và sau đósẽ không phải là một số nguyên. Nhưng có điều kiện trên lề, sẽ có phân phối siêu bội.μ|X1,1μ|X1,1

Nếu bạn thực hiện đúng và sửa các lề thành các giá trị đã biết, bạn có thể coi (hoặc bất kỳ ô nào khác) là số liệu thống kê của bạn. Với sự tương tự của việc vẽ bóng từ một chiếc bình chứa bóng trắng và bóng đen mà không cần thay thế, có thể được hiểu là số lượng bóng trắng được rút ra, trong đó là tổng của hàng đầu tiên, là tổng của hàng thứ hai, là tổng của cột đầu tiên. k W B X 1 , 1 B W kX1,1kWBX1,1BWk


4

Nó không thực sự có một. Thống kê kiểm tra là một sự bất thường trong lịch sử - lý do duy nhất chúng tôi có một thống kê kiểm tra là để đạt được giá trị p. Kiểm tra chính xác của Fisher nhảy qua một thống kê kiểm tra và đi thẳng đến giá trị p.


Cảm ơn, nhưng thực sự không có một thống kê kiểm tra? Làm thế nào để bạn xác định giá trị p sau đó?
Tim

Kết quả kiểm tra chính xác của Fisher là giá trị p.
Jeremy Miles

@JeremyMiles: Ý bạn là số liệu thống kê kiểm tra là sự bất thường trong lịch sử trước khi tính toán chi phí thấp, người dùng đã tính Z, t và sau đó so sánh thống kê kiểm tra này với các bảng được tính toán trước để xác định ý nghĩa thống kê và kết quả là, nhiều người dùng hiện tại của thống kê suy luận vẫn nghĩ về mặt thống kê kiểm tra khi họ có thể dễ dàng cung cấp giá trị p? Nói cách khác, đây có phải là một loại hiệu ứng thế hệ?
rabidotter

1
@rabidotter - vâng, tôi đoán là tôi làm. Bạn thấy những người viết "F = 14.352, df = 2, 568, p <0,05". Khá nhiều lý do duy nhất bất cứ ai quan tâm đến F là tính P, nhưng họ cho F với độ chính xác lớn và p với độ chính xác rất thấp.
Jeremy Miles
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.