Giống như các thử nghiệm tham số khác, phân tích phương sai giả định rằng dữ liệu phù hợp với phân phối bình thường. Nếu biến đo lường của bạn không được phân phối bình thường, bạn có thể tăng cơ hội cho kết quả dương tính giả nếu bạn phân tích dữ liệu bằng anova hoặc thử nghiệm khác giả định tính quy phạm. May mắn thay, một anova không nhạy cảm lắm với độ lệch vừa phải so với tính quy tắc; nghiên cứu mô phỏng, sử dụng nhiều phân phối không bình thường, đã chỉ ra rằng tỷ lệ dương tính giả không bị ảnh hưởng nhiều bởi sự vi phạm giả định này (Glass et al. 1972, Harwell et al. 1992, Lix et al. 1996). Điều này là do khi bạn lấy một số lượng lớn các mẫu ngẫu nhiên từ dân số, phương tiện của các mẫu đó được phân phối bình thường ngay cả khi dân số không bình thường.
Có thể kiểm tra mức độ phù hợp của dữ liệu được đặt thành phân phối bình thường. Tôi không khuyên bạn nên làm điều này, bởi vì nhiều bộ dữ liệu không bình thường đáng kể sẽ hoàn toàn phù hợp với anova.
Thay vào đó, nếu bạn có một bộ dữ liệu đủ lớn, tôi khuyên bạn chỉ nên nhìn vào biểu đồ tần số. Nếu nó trông ít nhiều bình thường, hãy tiếp tục và thực hiện một anova. Nếu nó trông giống như một phân phối bình thường đã bị đẩy sang một bên, như dữ liệu sunfat ở trên, bạn nên thử các phép biến đổi dữ liệu khác nhau và xem liệu bất kỳ trong số chúng làm cho biểu đồ trông bình thường hơn. Nếu điều đó không hiệu quả và dữ liệu vẫn trông không bình thường, có lẽ vẫn ổn để phân tích dữ liệu bằng cách sử dụng anova. Tuy nhiên, bạn có thể muốn phân tích nó bằng cách sử dụng một bài kiểm tra không tham số. Gần như mọi bài kiểm tra thống kê tham số đều có phần thay thế không tham số, chẳng hạn như bài kiểm tra Kruskalifer Wallis thay vì bài kiểm tra anova một chiều, bài kiểm tra xếp hạng có chữ ký của Wilcoxon thay vì bài kiểm tra t cặp và tương quan xếp hạng Spearman thay vì hồi quy tuyến tính. Các thử nghiệm không tham số này không cho rằng dữ liệu phù hợp với phân phối bình thường. Tuy nhiên, họ cho rằng dữ liệu trong các nhóm khác nhau có cùng phân phối với nhau; nếu các nhóm khác nhau có các phân phối có hình dạng khác nhau (ví dụ: một nhóm bị lệch sang trái, một nhóm khác bị lệch sang phải), một thử nghiệm không tham số có thể không tốt hơn một thử nghiệm tham số.
Tài liệu tham khảo
- Thủy tinh, GV, PD Peckham và JR Sanders. Năm 1972. Hậu quả của việc không đáp ứng các giả định dựa trên các phân tích hiệu ứng cố định của phương sai và hiệp phương sai. Mục sư giáo dục. Độ phân giải 42: 237-288.
- Harwell, MR, EN Rubinstein, WS Hayes và CC Olds. 1992. Tóm tắt kết quả Monte Carlo trong nghiên cứu phương pháp: các hiệu ứng cố định một và hai yếu tố ANOVA. J. Giáo dục. Thống kê 17: 315-39.
- Lix, LM, JC Keselman và HJ Keselman. 1996. Hậu quả của các vi phạm giả định được xem xét lại: Một đánh giá định lượng về các lựa chọn thay thế cho phân tích một chiều của thử nghiệm phương sai F. Mục sư giáo dục. Độ phân giải 66: 579-619.