Tại sao Levene kiểm tra sự bằng nhau của phương sai thay vì tỷ lệ F?


21

SPSS sử dụng thử nghiệm Levene để đánh giá tính đồng nhất của phương sai trong quy trình thử nghiệm t nhóm độc lập.

Tại sao phép thử Levene tốt hơn tỷ lệ F đơn giản của tỷ lệ phương sai của hai nhóm?


Câu trả lời:


34

Bạn có thể sử dụng thử nghiệm F để đánh giá phương sai của hai nhóm, nhưng việc sử dụng F để kiểm tra sự khác biệt về phương sai đòi hỏi nghiêm ngặt rằng các phân phối là bình thường. Sử dụng thử nghiệm của Levene (nghĩa là các giá trị tuyệt đối của độ lệch so với giá trị trung bình) mạnh hơn và sử dụng thử nghiệm Brown-Forsythe (nghĩa là giá trị tuyệt đối của độ lệch so với trung vị ) thậm chí còn mạnh mẽ hơn. SPSS đang sử dụng một cách tiếp cận tốt ở đây.

Cập nhật Đáp lại bình luận bên dưới, tôi muốn làm rõ những gì tôi đang cố gắng nói ở đây. Câu hỏi hỏi về việc sử dụng "tỷ lệ F đơn giản của tỷ lệ phương sai của hai nhóm". Từ điều này, tôi hiểu giải pháp thay thế là điều mà đôi khi được gọi là bài kiểm tra của Hartley , đây là một cách tiếp cận rất trực quan để đánh giá tính không đồng nhất của phương sai. Mặc dù điều này không sử dụng tỷ lệ phương sai, nhưng nó không giống với tỷ lệ được sử dụng trong thử nghiệm của Levene. Bởi vì đôi khi thật khó để hiểu ý nghĩa của nó khi nó chỉ được nói bằng lời, tôi sẽ đưa ra các phương trình để làm cho điều này rõ ràng hơn.

F=s22s12
F=MSb/tlevetôiSMSw/tôi-tôievetôiS

Trong cả ba trường hợp, chúng ta có tỷ lệ phương sai, nhưng phương sai cụ thể được sử dụng khác nhau giữa chúng. Điều làm cho thử nghiệm của Levene và thử nghiệm Brown-Forsythe mạnh mẽ hơn (và cũng khác biệt với bất kỳ ANOVA nào khác), là chúng được thực hiện trên dữ liệu được chuyển đổi , trong khi tỷ lệ F của phương sai nhóm (thử nghiệm của Hartley) sử dụng dữ liệu thô. Dữ liệu được chuyển đổi trong câu hỏi là các giá trị tuyệt đối của độ lệch (từ giá trị trung bình, trong trường hợp thử nghiệm của Levene và từ trung vị, trong trường hợp thử nghiệm Brown-Forsythe).

Có những bài kiểm tra khác về tính không đồng nhất của phương sai, nhưng tôi hạn chế thảo luận về những điều này, vì tôi hiểu chúng là trọng tâm của câu hỏi ban đầu. Lý do để lựa chọn trong số họ dựa trên hiệu suất của họ nếu dữ liệu gốc không thực sự bình thường; với thử nghiệm F là không đủ mạnh mẽ mà nó không được khuyến khích; Thử nghiệm Levene của là hơi mạnh hơn BF nếu các dữ liệu thực sự là bình thường, nhưng không khá là mạnh mẽ nếu họ không. Trích dẫn chính ở đây là O'Brien (1981), mặc dù tôi không thể tìm thấy phiên bản có sẵn trên internet. Tôi xin lỗi nếu tôi hiểu nhầm câu hỏi hoặc không rõ ràng.


2
Bởi vì thống kê của Levene là tỷ lệ hình vuông được xây dựng từ những phần dư tuyệt đối đó và được đề cập đến phân phối F, nên không rõ ràng rằng nó sẽ mạnh hơn bất kỳ thử nghiệm nào khác dựa trên tỷ lệ hình vuông! Bạn có thể nghĩ về các biến thể mạnh mẽ hơn, chẳng hạn như thử nghiệm Brown-Forsythe . Xem một cuộc thảo luận tốt của @chl tại stats.stackexchange.com/questions/2591/ .
whuber

@whuber, cảm ơn các bình luận và liên kết. Có quá nhiều để trả lời trong một bình luận, vì vậy tôi đã chỉnh sửa câu trả lời của mình. Tôi tin rằng những gì tôi đang cố gắng nhận được nên rõ ràng hơn bây giờ. Tuy nhiên, nếu tôi hiểu sai, hoặc đơn giản là sai, tôi có thể xóa câu trả lời này.
gung - Phục hồi Monica

Đoạn cuối (mới) làm cho quan điểm của bạn tốt (+1).
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.