Kiểm tra các giả định ANOVA


16

Vài tháng trước tôi đã đăng một câu hỏi về các bài kiểm tra đồng tính trong R trên SO, và Ian Fellows đã trả lời rằng (tôi sẽ diễn giải câu trả lời của anh ấy rất lỏng lẻo):

Kiểm tra độ đồng đều không phải là một công cụ tốt khi kiểm tra mức độ phù hợp của mô hình của bạn. Với các mẫu nhỏ, bạn không có đủ sức mạnh để phát hiện các lần khởi hành từ tính đồng nhất, trong khi với các mẫu lớn, bạn có "nhiều năng lượng", do đó, bạn có nhiều khả năng sàng lọc các lần khởi hành tầm thường từ sự bình đẳng.

Câu trả lời tuyệt vời của anh ấy đến như một cái tát vào mặt tôi. Tôi đã từng kiểm tra các giả định về tính quy tắc và tính đồng nhất mỗi khi tôi chạy ANOVA.

Theo bạn, thực tiễn tốt nhất khi kiểm tra các giả định ANOVA là gì?

Câu trả lời:


11

Trong các cài đặt được áp dụng, điều quan trọng hơn là phải biết liệu có bất kỳ vi phạm giả định nào có vấn đề đối với suy luận hay không.

Các thử nghiệm giả định dựa trên các thử nghiệm quan trọng hiếm khi được quan tâm trong các mẫu lớn, bởi vì hầu hết các thử nghiệm suy luận đều mạnh mẽ đối với các vi phạm giả định nhẹ.

Một trong những tính năng hay của các đánh giá đồ họa về các giả định là chúng tập trung chú ý vào mức độ vi phạm và không có ý nghĩa thống kê của bất kỳ vi phạm nào.

Tuy nhiên, bạn cũng có thể tập trung vào các bản tóm tắt số của dữ liệu để định lượng mức độ vi phạm các giả định và không có ý nghĩa thống kê (ví dụ: giá trị độ lệch, giá trị kurtosis, tỷ lệ chênh lệch nhóm lớn nhất đến nhỏ nhất, v.v.). Bạn cũng có thể nhận được các lỗi tiêu chuẩn hoặc khoảng tin cậy đối với các giá trị này, các giá trị này sẽ nhỏ hơn với các mẫu lớn hơn. Quan điểm này phù hợp với ý tưởng chung rằng ý nghĩa thống kê không tương đương với tầm quan trọng thực tế.


1
+1 cho câu trả lời tuyệt vời kết thúc mọi thứ. Làm thế nào để áp dụng các thủ tục nêu số được mô tả độc đáo và applicably trong Tabachnik và Fidell của Sử dụng đa biến thống kê (SPSS và SAS): amazon.com/Using-Multivariate-Statistics-Barbara-Tabachnick/dp/... (Nhưng hãy xem Erratas trên trang web đi kèm)
Henrik

Chà, tôi nghĩ rằng hầu hết các tóm tắt thời gian như xiên và kurtosis có rất ít giá trị, biến thể lấy mẫu của chúng chỉ là lớn. Tuy nhiên, người ta có thể xem xét thay thế chúng bằng L_skewness và L-kurtosis.
kjetil b halvorsen 11/03/2016

@kjetilbhalvorsen Tôi đoán nó phụ thuộc vào loại cỡ mẫu bạn thường làm việc với. Theo kinh nghiệm của tôi, các sơ đồ và số liệu thống kê sai lệch rất hữu ích trong việc tìm hiểu phân phối dữ liệu.
Jeromy Anglim

@Jeromy Anglim: OK. Sau đó, tôi đoán bạn thường có kích thước mẫu rất lớn! Bạn đã thử bootstrap hệ số xiên / kurtosis của bạn?
kjetil b halvorsen 11/03/2016

9

Một vài biểu đồ thường sẽ được khai sáng hơn nhiều so với giá trị p từ một bài kiểm tra về tính quy tắc hoặc tính đồng nhất. Âm mưu quan sát các biến phụ thuộc chống lại các biến độc lập. Âm mưu quan sát chống lại phù hợp. Lô dư chống lại các biến độc lập. Điều tra bất cứ điều gì trông lạ trên những mảnh đất này. Nếu một cái gì đó không có vẻ lạ, tôi sẽ không lo lắng về một thử nghiệm quan trọng của một giả định.


Lời khuyên tốt hầu hết thời gian, nhưng còn trường hợp bộ dữ liệu lớn, nơi bạn không thể xem xét tất cả các dữ liệu theo cách thủ công thì sao?
dsimcha

1
@dsimcha Nó cũng phụ thuộc vào cỡ mẫu trên mỗi nhóm. Ví dụ, người ta biết rằng khi các mẫu có kích thước bằng nhau, phép thử t mạnh mẽ chống lại sự rời khỏi giả định homoscedasticity; nếu , thì xác suất xảy ra lỗi loại I sẽ là nếu lớn hơn được liên kết với mẫu lớn hơn và ngược lại . Xem Zar, Phân tích thống kê sinh học của JH (Ed 4, Prentice Hall, 1998) để tham khảo thêm. < alpha σ 2n1n2<ασ2
chl

2
@dsimcha re bộ dữ liệu lớn: phụ thuộc vào ý của bạn là "lớn". Nhiều quan sát? Sử dụng đồ họa tốt (boxplot, dotplots jitter, sunflowerplots). Nhiều biến độc lập? Vâng, bạn có một điểm ở đó ... Nhưng nếu bạn có quá nhiều IV mà bạn không thể vẽ DV theo từng IV, tôi sẽ đặt câu hỏi bằng cách sử dụng ANOVA - có vẻ như khó có thể diễn giải trong bất kỳ trường hợp Một số phương pháp học máy thông minh có thể tốt hơn (Brian D. Ripley: "Để diễn giải một cách khiêu khích, 'học máy là số liệu thống kê trừ đi mọi kiểm tra mô hình và giả định'.")
S. Kolassa - Tái lập lại

Nhận xét tốt, +1. Mặc dù câu hỏi cụ thể này là về ANOVA, tôi đã suy nghĩ ở cấp độ tổng quát hơn về câu hỏi về cốt truyện so với các bài kiểm tra khi tôi viết câu trả lời của mình.
dsimcha

4

Đây là một số hướng dẫn web rất tốt để kiểm tra các giả định của ANOVA và phải làm gì nếu thất bại. Đây là một. Đây là một cái khác.

Về cơ bản mắt của bạn là thẩm phán tốt nhất, do đó, làm một số phân tích dữ liệu thăm dò . Điều đó có nghĩa là vẽ đồ thị dữ liệu - biểu đồ và sơ đồ hộp là một cách tốt để đánh giá tính chuẩn và tính đồng nhất. Và hãy nhớ ANOVA là mạnh mẽ để vi phạm nhỏ trong số này.


4

Cốt truyện QQ là những cách khá tốt để phát hiện tính phi quy tắc.

Đối với tính đồng nhất, hãy thử kiểm tra của Levene hoặc kiểm tra Brown-Forsythe. Cả hai đều tương tự nhau, mặc dù BF mạnh hơn một chút. Chúng ít nhạy cảm với tính phi quy tắc hơn so với thử nghiệm của Bartlett, nhưng thậm chí, tôi vẫn thấy chúng không đáng tin cậy nhất với kích thước mẫu nhỏ.

Cốt truyện QQ

Brown-Forsythe kiểm tra

Bài kiểm tra của Levene


Các lô phân phối tương đối (hoặc ví dụ, so với phân phối bình thường) có thể là một sự thay thế tốt, vì cách giải thích của chúng có thể rõ ràng hơn cho người mới bắt đầu.
kjetil b halvorsen 11/03/2016

3

Tôi đồng ý với những người khác rằng thử nghiệm ý nghĩa cho các giả định là có vấn đề.

kk

Các phương pháp bán tham số (xếp hạng) như xét nghiệm Wilcoxon và Kruskal-Wallis đưa ra các giả định ít hơn nhiều. Logit của ECDF phải song song với các thử nghiệm Wilcoxon-Kruskal-Wallis để có sức mạnh tối đa (lỗi loại I không bao giờ là vấn đề đối với chúng). Tuyến tính là không cần thiết. Kiểm tra xếp hạng đưa ra các giả định về cách phân phối của các nhóm khác nhau có liên quan đến nhau, nhưng không đưa ra các giả định về hình dạng của bất kỳ một phân phối nào.


Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.