Tại sao F-test rất nhạy cảm đối với giả định về tính quy tắc?


16

Tại sao F -test cho sự khác biệt về phương sai rất nhạy cảm với giả định phân phối bình thường, ngay cả đối với lớn ?N

Tôi đã cố gắng tìm kiếm trên web và ghé thăm thư viện, nhưng không ai trong số đó đưa ra bất kỳ câu trả lời hay nào. Nó nói rằng thử nghiệm rất nhạy cảm vì vi phạm giả định phân phối bình thường, nhưng tôi không hiểu tại sao. Có ai có một câu trả lời tốt cho điều này?


6
-testF mà bạn quan tâm?
S. Kolassa - Tái lập Monica

F-test để đo sự khác biệt về phương sai.
Magnus Johannesen

Câu trả lời:


35

Tôi cho rằng bạn có nghĩa là phép thử F cho tỷ lệ phương sai khi kiểm tra một cặp phương sai mẫu cho sự bằng nhau (vì đó là phép thử đơn giản nhất khá nhạy cảm với tính quy tắc; Thử nghiệm F cho ANOVA ít nhạy hơn)

Nếu các mẫu của bạn được rút ra từ các phân phối bình thường, phương sai mẫu có phân phối chi bình phương tỷ lệ

Hãy tưởng tượng rằng thay vì dữ liệu được rút ra từ các bản phân phối bình thường, bạn có bản phân phối có đuôi nặng hơn bình thường. Sau đó, bạn sẽ nhận được quá nhiều phương sai lớn so với phân phối chi bình phương tỷ lệ đó và xác suất của phương sai mẫu thoát ra ở đuôi bên phải rất nhạy với các đuôi của phân phối mà dữ liệu được rút ra =. (Cũng sẽ có quá nhiều phương sai nhỏ, nhưng hiệu ứng hơi kém rõ rệt)

Bây giờ nếu cả hai mẫu được rút ra từ phân phối đuôi nặng hơn đó, đuôi lớn hơn trên tử số sẽ tạo ra vượt quá giá trị F lớn và đuôi lớn hơn trên mẫu số sẽ tạo ra vượt quá giá trị F nhỏ (và ngược lại cho đuôi trái)

Cả hai hiệu ứng này sẽ có xu hướng dẫn đến sự từ chối trong thử nghiệm hai đuôi, mặc dù cả hai mẫu đều có cùng phương sai . Điều này có nghĩa là khi phân phối thực sự có đuôi nặng hơn bình thường, mức ý nghĩa thực tế có xu hướng cao hơn chúng ta muốn.

Ngược lại, vẽ mẫu từ phân phối đuôi nhẹ hơn sẽ tạo ra phân phối phương sai mẫu có đuôi quá ngắn - các giá trị phương sai có xu hướng "trung gian" hơn so với dữ liệu từ phân phối bình thường. Một lần nữa, tác động mạnh hơn ở đuôi trên so với đuôi dưới.

Bây giờ nếu cả hai mẫu được rút ra từ phân phối có đuôi nhẹ hơn, thì kết quả này sẽ vượt quá giá trị F gần trung vị và quá ít ở một trong hai đuôi (mức ý nghĩa thực tế sẽ thấp hơn mong muốn).

Những hiệu ứng này dường như không nhất thiết phải giảm nhiều với cỡ mẫu lớn hơn; trong một số trường hợp nó dường như trở nên tồi tệ hơn

Bằng cách minh họa một phần, đây là 10000 phương sai mẫu (cho n= =10 ) cho các phân phối chuẩn, t5 và thống nhất, được chia tỷ lệ để có cùng ý nghĩa với χ92 :

nhập mô tả hình ảnh ở đây

Thật khó để nhìn thấy đuôi xa vì nó tương đối nhỏ so với đỉnh (và đối với t5 các quan sát ở đuôi mở rộng ra một cách công bằng mà chúng ta đã âm mưu), nhưng chúng ta có thể thấy một số hiệu ứng trên sự phân bố trên phương sai. Có lẽ thậm chí nhiều hướng dẫn hơn để biến đổi những điều này bằng nghịch đảo của cdf chi-vuông,

nhập mô tả hình ảnh ở đây

trong trường hợp bình thường trông đồng nhất (như bình thường), trong trường hợp t có một đỉnh lớn ở đuôi trên (và một đỉnh nhỏ hơn ở đuôi dưới) và trong trường hợp đồng phục giống như đồi hơn nhưng rộng hơn đỉnh khoảng 0,6 đến 0,8 và cực trị có xác suất thấp hơn nhiều so với mức chúng ta nên lấy mẫu từ các phân phối bình thường.

F9,9

nhập mô tả hình ảnh ở đây

t5

Sẽ có nhiều trường hợp khác để điều tra cho một nghiên cứu đầy đủ, nhưng điều này ít nhất mang lại cảm giác về loại và hướng hiệu quả, cũng như cách nó phát sinh.


1
Bản demo thực sự tuyệt vời
Shadowtalker

3

Như Glen_b đã minh họa rất xuất sắc trong các mô phỏng của mình, thử nghiệm F cho tỷ lệ phương sai rất nhạy cảm với các đuôi của phân phối. Lý do cho điều này là do phương sai của phương sai mẫu phụ thuộc vào tham số kurtosis, và do đó, sự suy yếu của phân phối cơ bản có tác động mạnh mẽ đến sự phân bố tỷ lệ phương sai mẫu.

SN2Sn2n<N

SN2Sn2~Xấp xỉn-1N-1+N-nN-1F(DFC,DFn),

κ

DFn= =2nκ-(n-3)/(n-1)DFC= =2(N-n)2+(κ-3)(1-2/N+1/Nn).

Trong trường hợp đặc biệt của phân phối mesokurtic (ví dụ: phân phối bình thường) bạn có κ= =3, mang lại mức độ tự do tiêu chuẩn DFn= =n-1DFC= =N-n.

Mặc dù sự phân bố của tỷ lệ phương sai rất nhạy cảm với sự suy yếu tiềm ẩn, nhưng nó không thực sự rất nhạy cảm với tính bình thường trên mỗi se . Nếu bạn sử dụng phân phối mesokurtic với hình dạng khác với bình thường, bạn sẽ thấy rằng xấp xỉ phân phối F tiêu chuẩn thực hiện khá tốt. Trong thực tế, sự suy yếu tiềm ẩn chưa được biết rõ, vì vậy việc thực hiện công thức trên đòi hỏi phải thay thế một công cụ ước tínhκ^. Với sự thay thế như vậy, phép tính gần đúng sẽ thực hiện hợp lý.


Lưu ý rằng bài viết này xác định phương sai dân số bằng cách sử dụng hiệu chỉnh của Bessel (vì những lý do được nêu trong bài báo, trang 282-283). Vậy mẫu số của phương sai dân số làN-1 trong phân tích này, không phải N. (Đây thực sự là một cách hữu ích hơn để làm mọi việc, vì phương sai dân số khi đó là một công cụ ước tính không thiên vị của tham số phương sai siêu bội.)


+1 Đây là một bài viết rất thú vị. Chắc chắn với các phân phối mesokurtic, việc phân phối tỷ lệ phương sai càng xa F càng tốt với một lựa chọn phân phối đầy đủ nhưng không quá khó để xác định các trường hợp (ở cỡ mẫu trong câu trả lời của tôi, 10 và 10) trong đó tỷ lệ lỗi loại I thực tế cách xa tỷ lệ danh nghĩa 0,05 một chút. 3 trường hợp đầu tiên mà tôi đã thử (phân phối với kurtosis dân số = 3 - tất cả đều đối xứng) có tỷ lệ loại bỏ loại I là 0,0379, 0,0745 và 0,0785. ... ctd
Glen_b -Reinstate Monica

Ctd ... Tôi có chút nghi ngờ rằng các trường hợp cực đoan hơn có thể được xác định với một chút suy nghĩ về cách làm cho sự gần đúng trở nên tồi tệ hơn. Tôi tưởng tượng rằng nó (rằng mức ý nghĩa sẽ không bị ảnh hưởng nhiều) mặc dù có thể giữ tốt hơn trong các mẫu lớn hơn.
Glen_b -Reinstate Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.