Các biện pháp lặp đi lặp lại ANOVA: giả định quy tắc là gì?


15

Tôi bối rối về giả định quy tắc trong các biện pháp lặp lại ANOVA. Cụ thể, tôi đang tự hỏi loại bình thường chính xác nên được thỏa mãn. Khi đọc tài liệu và câu trả lời trên CV, tôi đã bắt gặp ba từ riêng biệt của giả định này.

  1. Biến phụ thuộc trong mỗi điều kiện (lặp lại) nên được phân phối bình thường.

    Người ta thường nói rằng rANOVA có các giả định tương tự như ANOVA, cộng với tính hình cầu. Đó là yêu cầu trong thống kê Khám phá của Field cũng như trong bài viết của Wikipedia về chủ đề và văn bản của Lowry .

  2. Phần dư (sự khác biệt giữa tất cả các cặp có thể?) Nên được phân phối bình thường.

    Tôi tìm thấy tuyên bố này trong nhiều câu trả lời trên CV ( 1 , 2 ). Bằng cách tương tự rANOVA với thử nghiệm t được ghép nối , điều này cũng có vẻ trực quan.

  3. Tính đa biến cần được thỏa mãn.

    Wikipedia và nguồn này đề cập đến điều này. Ngoài ra, tôi biết rằng rANOVA có thể được hoán đổi với MANOVA, điều này có thể xứng đáng với tuyên bố này.

Là những tương đương bằng cách nào đó? Tôi biết rằng tính quy tắc đa biến có nghĩa là bất kỳ tổ hợp tuyến tính nào của DV thường được phân phối, vì vậy 3. sẽ tự nhiên bao gồm 2. nếu tôi hiểu chính xác sau.

Nếu những điều này không giống nhau, đó là giả định "đúng" của rANOVA? Bạn có thể cung cấp một tài liệu tham khảo?

Dường như với tôi có sự hỗ trợ nhiều nhất cho yêu cầu đầu tiên. Điều này không phù hợp, tuy nhiên, với các câu trả lời thường được cung cấp ở đây.


Mô hình hỗn hợp tuyến tính

Do gợi ý của @ utobi, giờ đây tôi đã hiểu rANOVA có thể được trình bày lại như một mô hình hỗn hợp tuyến tính. Cụ thể, để mô hình hóa huyết áp thay đổi theo thời gian như thế nào, tôi sẽ mô hình giá trị mong đợi là: trong đó y i j là các phép đo huyết áp, a i là máu trung bình áp lực của đối tượng thứ it i j là lần thứ j đối tượng thứ i được đo, b i

E[yij]=ai+bitij,
yijaiitijjibibiểu thị rằng sự thay đổi huyết áp cũng khác nhau giữa các đối tượng. Cả hai hiệu ứng được coi là ngẫu nhiên, vì mẫu của các đối tượng chỉ là một tập hợp con ngẫu nhiên của dân số, được quan tâm chính.

Cuối cùng, tôi đã cố gắng nghĩ về điều này có ý nghĩa gì đối với sự bình thường, nhưng ít thành công. Để diễn giải McCulloch và Searle (2001, trang 35. Phương trình (2.14)):

E[yij|ai]=aiyij|aiindep. N(ai,σ2)aii.i.d. N(a,σa2)

Tôi hiểu điều này có nghĩa là

4. dữ liệu của mỗi cá nhân cần được phân phối bình thường, nhưng điều này không hợp lý để kiểm tra với một vài điểm thời gian.

Tôi lấy biểu thức thứ ba để nói rằng

5. trung bình của các đối tượng cá nhân được phân phối bình thường. Lưu ý rằng đây là hai khả năng khác biệt trên đầu trang của ba đề cập ở trên.


McCulloch, CE & Searle, SR (2001). Mô hình tổng quát, tuyến tính và hỗn hợp . New York: John Wiley & Sons, Inc.


chỉ để cung cấp cho bạn một đầu mối. Bạn có thể nêu mô hình rANOVA theo mô hình hỗn hợp tuyến tính (LMM). Khi bạn có LMM, bạn sẽ thấy ngay giả định quy tắc ngụ ý. Xem tại đây ( eu.wiley.com/WileyCDA/WileyTitle/productCd-0470073713.html ) để biết một số lý thuyết về LMM
utobi

Cảm ơn bạn, @utobi, vì sự tham khảo mà bạn cung cấp! Thật vậy, tôi đã nghiên cứu vài chương đầu tiên của nó, nhưng vẫn không tìm ra câu trả lời cho câu hỏi của mình. Tôi đã cập nhật nó để phản ánh những tiến bộ hạn chế tôi đã làm.
Fato39

3
Đây có vẻ là một câu hỏi hoàn toàn tốt cho tôi. Tôi đang bỏ phiếu để bỏ ngỏ.
gung - Phục hồi Monica

Đúng, dữ liệu của mỗi cá nhân cần được phân phối bình thường. Nhưng nếu bạn nhìn vào những gì bạn đã viết, tất cả các dữ liệu cá nhân sau khi được hạ thấp ( được trừ ra) sẽ có một bình bằng không và phương sai tương tự ( σ 2 một ). Vì vậy, bạn có thể giả sử tất cả các dữ liệu hạ thấp phát sinh từ một phân phối bình thường duy nhất. Bạn có thể nhìn vào phần dư để xem giả định này được đáp ứng tốt như thế nào. aiσa2
Heteroskedastic Jim

Câu trả lời:


2

Đây là mô hình ANOVA lặp đi lặp lại đơn giản nhất nếu chúng ta coi nó là mô hình đơn biến:

yit=ai+bt+ϵit

trong đó đại diện cho từng trường hợp và t lần chúng tôi đo chúng (vì vậy dữ liệu ở dạng dài). y tôi tityit đại diện cho các kết quả xếp chồng lên nhau, đại diện cho giá trị trung bình của từng trường hợp, b t đại diện cho giá trị trung bình của từng điểm thời gian và ϵ i t đại diện cho độ lệch của các phép đo riêng lẻ từ trường hợp và thời điểm . Bạn có thể bao gồm các yếu tố bổ sung giữa các yếu tố dự đoán trong thiết lập này.aibtϵit

Chúng ta không cần phải đưa ra các giả định phân phối về , vì chúng có thể đi vào mô hình dưới dạng các hiệu ứng cố định, các biến giả (trái với những gì chúng ta làm với các mô hình hỗn hợp tuyến tính). Điều tương tự xảy ra đối với người giả thời gian. Đối với mô hình này, bạn chỉ cần hồi quy kết quả ở dạng dài đối với người giả và người giả thời gian. Ảnh hưởng của lãi suất là các hình nộm thời gian, F -test kiểm tra giả thuyết null mà b 1 = . . . = b t = 0 là thử nghiệm chính trong các biện pháp lặp lại đơn biến ANOVA.aiFb1=...=bt=0

Các giả định bắt buộc để -test hành xử phù hợp là gì? Câu hỏi liên quan đến câu hỏi của bạn là:F

ϵitN(0,σ)these errors are normally distributed and homoskedastic

F

Nếu bạn muốn coi các biện pháp lặp đi lặp lại ANOVA như một mô hình đa biến, các giả định về tính quy tắc có thể khác và tôi không thể mở rộng chúng ra ngoài những gì bạn và tôi đã thấy trên Wikipedia.


0

Có thể tìm thấy giải thích về tính quy phạm của ANOVA đo lặp lại ở đây:

Hiểu các giả định ANOVA đo lặp lại để giải thích chính xác đầu ra SPSS


31325


2
Federico, cảm ơn bạn đã trả lời. Tôi đã nhận thức được lời giải thích này (xem điểm số 2 của tôi và liên kết CV đầu tiên được tham chiếu ở đó). Trong khi tôi đánh giá cao chất lượng câu trả lời trên CV, tôi đã đi đến những câu trả lời khác nhau (mâu thuẫn?) Cho câu hỏi của tôi khi tư vấn các nguồn khác nhau. Do đó, tôi thích một nguồn có thể giải quyết rõ ràng hoặc kết luận các sắc thái tôi đã đề cập trong năm điểm trên của tôi.
Fato39
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.