Tại sao các biện pháp lặp đi lặp lại ANOVA giả định tính hình cầu?


10

Tại sao các biện pháp lặp đi lặp lại ANOVA giả định tính hình cầu?

Theo tính toàn cầu, tôi muốn nói rằng giả định rằng phương sai của tất cả các khác biệt theo cặp giữa các nhóm phải giống nhau.

Cụ thể, tôi không hiểu tại sao điều này nên là giả định và không phải là phương sai của điểm số của nhóm được quan sát là như nhau.


1
Như tôi đã nhận xét ở đây , bởi vì các biến số khác nhau giữa các cấp độ RM được ràng buộc, bởi nguồn gốc của chúng, tính hình cầu sau đó ngụ ý rằng chúng có cùng phương sai.
ttnphns

1
Trước khi trả lời, sẽ rất hữu ích nếu bạn biết nếu bạn hiểu tại sao các biện pháp độc lập ANOVA có giả định về tính đồng nhất của phương sai.
Giăng

@ John Sự hiểu biết của tôi đây là câu trả lời được đưa ra tại stats.stackexchange.com/questions/81914/. Trả lời đúng câu hỏi đó.
user1205901 - Phục hồi Monica

@ttnphns Thật không may, tôi không hiểu câu trả lời của bạn. Bạn có muốn một số poster khác quan tâm để đưa nó ra thành một phản hồi chi tiết hơn không?
user1205901 - Phục hồi Monica

Câu trả lời:


2

Trực giác đằng sau giả định hình cầu

Một trong những giả định của các biện pháp phổ biến, không lặp lại, ANOVA là phương sai bằng nhau trong tất cả các nhóm.

(Chúng ta có thể hiểu điều đó bởi vì phương sai bằng nhau, còn được gọi là đồng đẳng , là cần thiết cho công cụ ước lượng OLS trong hồi quy tuyến tính là BLUE và để kiểm tra t tương ứng có hiệu lực, xem định lý Gaussuler Markov . Và ANOVA có thể được thực hiện dưới dạng tuyến tính hồi quy.)

Vì vậy, hãy cố gắng giảm trường hợp RM-ANOVA thành trường hợp không phải là RM. Để đơn giản, tôi sẽ xử lý một yếu tố RM-ANOVA (không có bất kỳ hiệu ứng giữa các chủ thể) có đối tượng được ghi trong điều kiện RM.nk

Mỗi đối tượng có thể có bù trừ cụ thể theo chủ đề riêng hoặc chặn. Nếu chúng tôi trừ các giá trị trong một nhóm khỏi các giá trị trong tất cả các nhóm khác, chúng tôi sẽ hủy các lần chặn này và đến tình huống khi chúng tôi có thể sử dụng phi-RM-ANOVA để kiểm tra xem các khác biệt của nhóm có bằng không. Để thử nghiệm này có hiệu lực, chúng tôi cần một giả định về phương sai bằng nhau của những khác biệt .k1k1

Bây giờ chúng ta có thể trừ nhóm 2 khỏi tất cả các nhóm khác, một lần nữa đạt đến sự khác biệt cũng nên có phương sai bằng nhau. Đối với mỗi nhóm trong số , phương sai của chênh lệch tương ứng phải bằng nhau. Nó nhanh chóng theo sau rằng tất cả các khác biệt có thể bằng nhau.k1kk1k(k1)/2

Mà chính xác là giả định hình cầu.

Tại sao phương sai nhóm không nên bằng nhau?

Khi chúng ta nghĩ về RM-ANOVA, chúng ta thường nghĩ về một mô hình kiểu mô hình hỗn hợp phụ gia đơn giản có dạng trong đó là các hiệu ứng chủ đề, là các hiệu ứng điều kiện và .

yij=μ+αi+βj+ϵij,
αiβjϵN(0,σ2)

Đối với mô hình này, các khác biệt nhóm sẽ tuân theo , tức là tất cả sẽ có cùng phương sai , do đó tính toàn cầu sẽ giữ. Nhưng mỗi nhóm sẽ theo một hỗn hợp gồm Gaussian với các phương tiện tại và variances , đó là một phân phối phức tạp với phương sai không đổi giữa các nhóm.N(βj1βj2,2σ2)2σ2nαiσ2V(α,σ2)

Vì vậy, trong mô hình này, thực sự, phương sai nhóm cũng giống nhau. Hiệp phương sai nhóm cũng giống nhau, có nghĩa là mô hình này ngụ ý đối xứng hợp chất . Đây là một điều kiện nghiêm ngặt hơn so với tính hình cầu. Như lập luận trực quan của tôi ở trên cho thấy, RM-ANOVA có thể hoạt động tốt trong tình huống chung hơn, khi mô hình phụ gia được viết ở trên không giữ được .

Báo cáo toán học chính xác

Tôi sẽ thêm vào đây một cái gì đó từ Huynh & Feldt, 1970, Điều kiện theo tỷ lệ bình phương trung bình nào trong các phép đo lặp đi lặp lại có chính xác Phân phốiF .

Điều gì xảy ra khi phá vỡ hình cầu?

Khi tính toàn cầu không giữ được, có lẽ chúng ta có thể mong đợi RM-ANOVA (i) có kích thước tăng cao (nhiều lỗi loại I hơn), (ii) bị giảm công suất (nhiều lỗi loại II hơn). Người ta có thể khám phá điều này bằng cách mô phỏng, nhưng tôi sẽ không làm điều đó ở đây.


4

Hóa ra, ảnh hưởng của vi phạm tính toàn cầu là mất điện (nghĩa là xác suất tăng của lỗi Loại II) và thống kê kiểm tra (tỷ lệ F) đơn giản là không thể so sánh với các giá trị được phân bổ theo bảng của phân phối F. Thử nghiệm F trở nên quá tự do (tức là tỷ lệ từ chối của giả thuyết null lớn hơn mức alpha khi giả thuyết null là đúng.

Điều tra chính xác về chủ đề này rất có liên quan, nhưng may mắn thay, Box et al đã viết một bài báo về điều đó: https://projecteuclid.org/doad/pdf_1/euclid.aoms/1177728786

Tóm lại, tình hình như sau. Trước tiên, giả sử chúng ta có một yếu tố thiết kế đo lặp lại với các đối tượng S và phương pháp điều trị thử nghiệm Trong trường hợp này, hiệu ứng của biến độc lập được kiểm tra bằng cách tính toán thống kê F, được tính là tỷ lệ của bình phương hiệu ứng trung bình theo bình phương trung bình của sự tương tác giữa các yếu tố chủ thể và biến độc lập. Khi tính toàn cầu giữ, số liệu thống kê này có phân phối Fisher với và bậc tự do.υ1=A1υ2=(A1)(S1)

Trong bài viết trên, Box đã tiết lộ rằng khi độ cầu không thành công, số bậc tự do chính xác sẽ trở thành của tỷ lệ F phụ thuộc vào độ cầu như vậy: υ1ϵ

υ1=ϵ(A1)
υ2=ϵ(A1)(S1)

Ngoài ra Box giới thiệu chỉ số hình cầu, áp dụng cho ma trận hiệp phương sai dân số . Nếu chúng ta gọi các mục của bảng AxA này, thì chỉ mục làξa,a

ϵ=(aξa,a)2(A1)a,aξa,a2

Chỉ số hình cầu của hộp được hiểu rõ nhất liên quan đến giá trị riêng của ma trận hiệp phương sai. Hãy nhớ lại rằng ma trận hiệp phương sai thuộc về loại ma trận bán xác định dương và do đó luôn có giá trị dương của giá trị riêng. Do đó, điều kiện hình cầu tương đương với việc có tất cả các giá trị riêng bằng một hằng số.

Vì vậy, khi tính toàn cầu bị vi phạm, chúng ta nên áp dụng một số hiệu chỉnh cho thống kê F của chúng tôi và ví dụ đáng chú ý nhất về sự điều chỉnh này là Greenhouse-Geisser và Huynh-Feldt, ví dụ

Nếu không có bất kỳ sự điều chỉnh nào, kết quả của bạn sẽ bị sai lệch và không đáng tin cậy. Hi vọng điêu nay co ich!


+1. Tôi sẽ bình luận nhiều hơn sau, nhưng bây giờ đoạn đầu tiên của bạn trộn lẫn sức mạnh và kích thước của bài kiểm tra. Điều gì bị suy yếu khi tính hình cầu bị vi phạm? Tỷ lệ lỗi loại I dưới null? Hay sức mạnh? Hoặc cả hai? Bạn có thể có nghĩa là cả hai, nhưng công thức không rõ ràng (tôi nghĩ). Ngoài ra, đó không phải là "Box et al", đó là Box một mình :)
amip nói rằng Rebstate Monica

Tôi nghĩ rằng sức mạnh sẽ bị suy giảm chủ yếu, vì như Box đã chỉ ra, khi tính toàn cầu bị xâm phạm, chúng ta phải dựa vào thống kê hoàn toàn khác nhau (với một mức độ tự do khác). Nếu chúng ta không dựa vào điều đó, thì tùy thuộc vào mức độ vi phạm của chúng ta mạnh đến mức nào, chúng ta sẽ có tỷ lệ từ chối lớn hơn của giả thuyết khống.
Viện sĩ hàn lâm rộng lớn

Xin lỗi, vẫn còn bối rối, bây giờ bởi nhận xét của bạn: "tỷ lệ từ chối lớn hơn của null" - ý bạn là khi null thực sự đúng? Nhưng điều này không liên quan gì đến sức mạnh, đây là tỷ lệ lỗi loại I.
amip nói rằng Phục hồi lại

+10. Tôi thưởng phần thưởng của mình cho câu trả lời này: nó hay và cũng là câu trả lời duy nhất xuất hiện trong thời kỳ tiền thưởng. Tôi không hoàn toàn hài lòng với câu trả lời của bạn (chưa?) Và tôi bắt đầu viết câu trả lời của riêng mình (hiện chưa đầy đủ, nhưng đã được đăng), nhưng tôi chỉ hiểu một phần về toán học cơ bản. Câu trả lời của bạn chắc chắn có ích và việc tham khảo Hộp 1954 cũng rất hữu ích.
amip nói phục hồi Monica

Một số khoảnh khắc khó hiểu hơn nữa. (1) Trường hợp Box giới thiệu chỉ số hình cầu trong bài báo này? Tôi không thấy nó cả. Công thức cho không xuất hiện trong bài báo này. (2) Bạn có chắc chắn rằng s trong công thức này là giá trị riêng của ma trận hiệp phương sai không? Tôi không nghĩ đó là sự thật: khi ma trận này thỏa mãn "điều kiện hình cầu" của RM-ANOVA thì giá trị bản địa của nó không phải bằng nhau. ϵϵξA×A
amip nói rằng Phục hồi lại

1

Tôi sẽ cố gắng trả lời câu hỏi này trong một thiết lập đơn giản của các biện pháp lặp lại ANOVA. Khái niệm này tương tự như câu trả lời của @amoeba, với hy vọng một minh họa cơ bản hơn. Giả sử rằng một nhóm đối tượng được chia ngẫu nhiên thành các nhóm khác nhau và mỗi đối tượng được đo với số lần bằng nhau. Đây là một thiết kế cốt truyện phân chia với các đối tượng là toàn bộ cốt truyện và các phép đo trong mỗi đối tượng như các quan sát của các ô phụ. Biểu thị là đo tại thứ k timepoint của j thứ chủ đề từ thứ i nhóm,yijki=1,...,I;j=1,...,J;k=1,...,K.

Giá trị trung bình mẫu của nhóm thứ i là

y¯i..=1JKj=1Jk=1Kyijk

và đối tượng của ij-th là

y¯ij.=1Kk=1Kyijk

Bằng cách giả định sự độc lập giữa các chủ thể, phương sai của sự khác biệt giữa hai nhóm có nghĩa là

Var(y¯i..y¯i..)=1J2j=1JVar(y¯ij.)+1J2j=1JVar(y¯ij.)

Đó là hợp lý để mong đợi rằng các phép đo lặp đi lặp lại trong một đối tượng là tương quan. Vì vậy, Không đơn giản như với là phương sai của mỗi quan sát. Bất kể, nếu Được giả định liên tục cho tất cả các đối tượng, người ta có thể hợp lệ thực hiện một "thẳng về phía trước" 2 mẫu t-test để so sánh 2 phương tiện nhóm. Do đó, một động lực để giả định phương sai không đổi là để thực hiện kiểm tra t hợp lệ và đơn giản. Var(y¯ij.)σ2/Kσ2Var(y¯ij.)

Bây giờ, đến câu hỏi về tính hình cầu đã được nêu ra.

Có thể có mối quan tâm để so sánh phương tiện mẫu giữa bất kỳ hai mốc thời gian nào với , trong đó So sánh này yêu cầu tìm phương sai của sự khác biệt theo cặp giữa và trên tất cả các đối tượng. Cụ thể, theo giả định thông thường về sự độc lập giữa các chủ thể,y¯..ky¯..k

y¯..k=1IJi=1Ij=1Jyijk.
yijkyijk

Var(y¯..ky¯..k)=1(IJ)2i=1Ij=1JVar(yijkyijk)

Do đó, giả sử phương sai không đổi của tất cả các khác biệt theo cặp sẽ khiến việc thực hiện kiểm tra t trở nên hợp lệ khi ước tính phương sai chung. Giả định này, cùng với phương sai không đổi của mỗi quan sát, ngụ ý rằng hiệp phương sai giữa bất kỳ cặp số đo nào là không đổi trên tất cả các cặp - Sergiocó một bài viết tuyệt vời về chủ đề này. Do đó, các giả định đưa ra cấu trúc phương sai hiệp phương sai cho các phép đo lặp lại của từng đối tượng dưới dạng ma trận với hằng số theo đường chéo và một hằng số khác nằm ngoài đường chéo. Khi các mục ngoài đường chéo đều bằng 0, nó sẽ giảm xuống mô hình độc lập hoàn toàn (có thể không phù hợp với nhiều nghiên cứu đo lặp lại). Khi các mục nhập chéo giống như mục chéo, các phép đo lặp lại hoàn toàn tương quan cho một đối tượng, có nghĩa là bất kỳ phép đo đơn lẻ nào cũng tốt như tất cả các phép đo cho từng đối tượng. Lưu ý cuối cùng - khi K = 2 trong thiết kế lô tách đơn giản của chúng tôi, điều kiện hình cầu được tự động đáp ứng.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.