Làm thế nào để thực hiện ANOVA trên dữ liệu vẫn không bình thường sau khi chuyển đổi?


8

Tôi đang xem xét các thất bại có hiệu lực và các điều kiện gây ra bẫy có đánh giá chủ quan về thất bại và bẫy ở ba thời điểm khác nhau (trong số những thứ khác).

Tuy nhiên, đánh giá chủ quan không được phân phối bình thường. Tôi đã thực hiện một số biến đổi và chuyển đổi squareroot dường như hoạt động tốt nhất. Tuy nhiên, vẫn còn một số khía cạnh của dữ liệu chưa được chuẩn hóa. Sự không bình thường này thể hiện ở sự sai lệch tiêu cực trong điều kiện thất bại cao Bẫy cao tại thời điểm tôi dự đoán sẽ có xếp hạng thất bại và bẫy cao nhất. Do đó, tôi nghĩ rằng có thể lập luận rằng sự sai lệch này là do các thao tác thử nghiệm.

Có thể chấp nhận chạy ANOVA trên dữ liệu này mặc dù thiếu tính quy tắc, do các thao tác không? Hoặc các xét nghiệm không tham số sẽ thích hợp hơn? Nếu vậy có tương đương không tham số của ANOVA hỗn hợp 4x3 không?

Câu trả lời:


15

Đó là phần dư nên được phân phối bình thường, không phải là phân phối biên của biến trả lời của bạn.

Tôi sẽ thử sử dụng các phép biến đổi, thực hiện ANOVA và kiểm tra các phần dư. Nếu chúng trông có vẻ không bình thường bất kể bạn sử dụng biến đổi nào, tôi sẽ chuyển sang thử nghiệm không tham số như thử nghiệm Friedman.


1
+1. Đáng chú ý là có các quy trình chính thức khá đơn giản để điều tra các biến đổi, chẳng hạn như các lô trải rộng so với mức (được mô tả trong EDA của Tukey ).
whuber

3

Tôi tin rằng với dữ liệu bị lệch, bạn có thể phải phản ánh dữ liệu để bị lệch dương trước khi áp dụng một chuyển đổi dữ liệu khác (ví dụ: log hoặc căn bậc hai). Tuy nhiên, điều này có xu hướng làm cho việc giải thích kết quả của bạn trở nên khó khăn.

Cỡ mẫu của bạn là bao nhiêu? Tùy thuộc vào mức độ chính xác của nó, các xét nghiệm tham số có thể đưa ra ước tính khá tốt.

Mặt khác, đối với một thay thế không tham số, có thể bạn có thể thử kiểm tra Friedman .

Ngoài ra, bạn có thể thử tiến hành MANOVA cho các biện pháp lặp đi lặp lại, bao gồm một biến thời gian rõ ràng, như là một thay thế cho ANOVA hỗn hợp 4x3. Một sự khác biệt lớn là giả định về tính hình cầu được nới lỏng (hay đúng hơn, nó được ước tính cho bạn) và tất cả các điểm thời gian của biến kết quả của bạn được trang bị cùng một lúc.


FWIW, bất kỳ chuyển đổi sức mạnh Box-Cox nào lớn hơn 1 sẽ làm giảm độ lệch âm. Tuy nhiên, theo phản ứng của Rob Hyndman, đó không phải là điều đầu tiên để thử.
whuber

2

Một phép biến đổi boxcox (có một trong gói MASS) hoạt động tốt trên dữ liệu sai lệch tích cực. FYI, bạn cần nhập một công thức trong hàm đó như y ~ 1 và đảm bảo rằng tất cả y đều dương trước tiên (nếu không chỉ thêm một hằng số như abs (min (y))). Bạn có thể phải điều chỉnh phạm vi lambda trong hàm để tìm đỉnh của đường cong. Nó sẽ cung cấp cho bạn giá trị lambda tốt nhất để chọn và sau đó bạn chỉ cần áp dụng biến đổi này:

b <- boxcox(y~1)
lambda <- b$x[b$y == max(b$y)]
yt <- (y^lambda-1)/lambda
#you can transform back with
ytb <- (t*lambda+1)^(1/lambda)

Xem dữ liệu của bạn là bình thường sau đó.

#you can transform back with
ytb <- (t*lambda+1)^(1/lambda)
#maybe put back the min
ytb <- ytb - abs(min(y))
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.