Giả thuyết khống về MANOVA là gì?


11

Lý lịch

Để phân tích sự khác biệt trong một số biến liên tục giữa các nhóm khác nhau (được đưa ra bởi một biến phân loại), người ta có thể thực hiện ANOVA một chiều. Nếu có một số biến giải thích (phân loại), người ta có thể thực hiện ANOVA nhân tử. Nếu người ta muốn phân tích sự khác biệt giữa các nhóm trong một số biến liên tục (nghĩa là một số biến trả lời), người ta phải thực hiện ANOVA đa biến (MANOVA).

Câu hỏi

Tôi hầu như không hiểu làm thế nào một người có thể thực hiện một thử nghiệm giống ANOVA trên một số biến trả lời và quan trọng hơn, tôi không hiểu giả thuyết null có thể là gì. Là giả thuyết khống:

  • "Đối với mỗi biến trả lời, phương tiện của tất cả các nhóm đều bằng nhau",

hoặc là nó

  • "Đối với ít nhất một biến trả lời, phương tiện của tất cả các nhóm là bằng nhau",

hay là cái gì khác?H0


Tôi không thể nói, bạn cũng đang hỏi làm thế nào ANOVA hoạt động? Trong bối cảnh thảo luận về lỗi tiêu chuẩn là gì, về cơ bản, tôi giải thích ý tưởng cơ bản đằng sau ANOVA ở đây: Lỗi tiêu chuẩn hoạt động như thế nào?
gung - Phục hồi Monica

Cả hai tuyên bố của bạn. H0của MANOVA là không có sự khác biệt trong không gian đa biến . Trường hợp đa biến phức tạp hơn đáng kể so với đơn biến vì chúng ta phải đối phó với hiệp phương sai, không chỉ là phương sai. Có một số cách để hình thành các H0-H1giả thuyết trong MANOVA. Đọc Wikipedia.
ttnphns

@ttnphns: Tại sao không? Các của ANOVA là phương tiện của tất cả các nhóm đều bình đẳng. Các H 0 của MANOVA là phương tiện đa biến của tất cả các nhóm đều bình đẳng. Đây chính xác là 1 thay thế trong OP. Hiệp phương sai, v.v. nhập các giả địnhtính toán của MANOVA, chứ không phải giả thuyết khống. H0H0
amip nói rằng phục hồi Monica

@amoeba, tôi không thích For each response variable. Đối với tôi nghe có vẻ như (hoặc tôi đọc nó là) "thử nghiệm được thực hiện một cách đơn lẻ trên mỗi cái" (và sau đó bằng cách nào đó kết hợp).
ttnphns

Câu trả lời:


9

Null giả thuyết của một chiều ANOVA là phương tiện của tất cả các nhóm đều bình đẳng: H 0 : μ 1 = μ 2 = . . . = μ k . Giả thuyết null H 0 của MANOVA một chiều là phương tiện [đa biến] của tất cả các nhóm đều bằng nhau:Điều này tương đương với việc nói rằng các phương tiện là bằng nhau cho mỗi biến trả lời, tức là tùy chọn đầu tiên của bạn là chính xác .H0

H0:μ1=μ2=...=μk.
H0
H0:μ1=μ2=...=μk.

Trong cả hai trường hợp, giả thuyết thay thế là sự phủ định của null. Trong cả hai trường hợp, các giả định là (a) phân phối trong nhóm Gaussian và (b) phương sai bằng nhau (đối với ANOVA) / ma trận hiệp phương sai (đối với MANOVA) giữa các nhóm.H1

Sự khác biệt giữa MANOVA và ANOVAs

Điều này có vẻ hơi khó hiểu: giả thuyết null của MANOVA hoàn toàn giống với sự kết hợp của các giả thuyết null cho một bộ sưu tập ANOVAs đơn biến, nhưng đồng thời chúng ta biết rằng làm MANOVA không tương đương với việc thực hiện ANOVAs đơn lẻ và sau đó bằng cách nào đó " kết hợp "kết quả (người ta có thể đưa ra nhiều cách kết hợp khác nhau). Tại sao không?

Câu trả lời là việc chạy tất cả các ANOVAs đơn biến, mặc dù sẽ kiểm tra giả thuyết null giống nhau, sẽ có ít năng lượng hơn. Xem câu trả lời của tôi ở đây để minh họa: Làm thế nào MANOVA có thể báo cáo một sự khác biệt đáng kể khi không có bất kỳ ANOVAs nào không đạt được tầm quan trọng? Phương pháp "kết hợp" ngây thơ (từ chối null toàn cầu nếu ít nhất một ANOVA từ chối null) cũng sẽ dẫn đến lạm phát rất lớn về tỷ lệ lỗi loại I; nhưng ngay cả khi người ta chọn một cách "kết hợp" thông minh nào đó để duy trì tỷ lệ lỗi chính xác, người ta sẽ mất quyền lực.

Cách kiểm tra hoạt động

ANOVA phân hủy các tổng bình phương vào giữa nhóm sum-of-ô vuông và trong nhóm sum-of-ô vuông , do đó . Sau đó nó sẽ tính toán tỷ lệ . Theo giả thuyết khống, tỷ lệ này phải nhỏ (khoảng ); người ta có thể tìm ra sự phân phối chính xác của tỷ lệ này dự kiến ​​theo giả thuyết null (nó sẽ phụ thuộc vào và vào số lượng nhóm). So sánh giá trị quan sát với phân phối này mang lại giá trị p.B W T = B + W B / W 1 n B / WTBWT=B+WB/W1nB/W

MANOVA phân hủy tổng phân tán ma trận vào giữa nhóm phân tán ma trận và trong nhóm phân tán ma trận , do đó . Sau đó nó sẽ tính toán ma trận . Theo giả thuyết khống, ma trận này phải là "nhỏ" (khoảng ); nhưng làm thế nào để định lượng nó "nhỏ" như thế nào? MANOVA xem xét giá trị riêng của ma trận này (tất cả đều dương). Một lần nữa, theo giả thuyết khống, các giá trị riêng này phải là "nhỏ" (tất cả khoảngB W T = B + W W - 1 B I λ i 1 Σ λ i max { λ i }TBWT=B+WW1BIλi1). Nhưng để tính giá trị p, chúng ta cần một số (được gọi là "thống kê") để có thể so sánh nó với phân phối dự kiến ​​của nó dưới giá trị null. Có một số cách để làm điều đó: lấy tổng của tất cả các giá trị riêng ; lấy giá trị riêng tối đa , v.v. Trong mỗi trường hợp, con số này được so sánh với phân phối của đại lượng này dự kiến ​​dưới giá trị p, dẫn đến giá trị p.λimax{λi}

Các lựa chọn khác nhau của thống kê kiểm tra dẫn đến các giá trị p hơi khác nhau, nhưng điều quan trọng là phải nhận ra rằng trong mỗi trường hợp, cùng một giả thuyết null đang được thử nghiệm.


Ngoài ra, nếu bạn không sửa cho nhiều thử nghiệm, phương pháp ANOVAs hoàn toàn đơn nhất cũng sẽ mang lại lạm phát loại I.
gung - Phục hồi Monica

1
@gung: Vâng, điều đó cũng đúng. Tuy nhiên, người ta có thể thông minh hơn trong việc "kết hợp" hơn là chỉ từ chối null ngay khi ít nhất một trong số ANOVAs từ chối null. Quan điểm của tôi là dù người thông minh cố gắng "kết hợp", người ta vẫn sẽ mất năng lượng so với MANOVA (ngay cả khi người ta cố gắng duy trì kích thước của bài kiểm tra mà không làm tăng tỷ lệ lỗi).
amip nói rằng Phục hồi lại

Nhưng không phải bây giờ "sức mạnh" liên quan trực tiếp đến khái niệm hiệp phương sai sao? Đạo đức là với một (một loạt) thử nghiệm đơn biến, chúng tôi chỉ kiểm tra hiệu ứng cận biên là SSdifference/SSerrorvô hướng. Trong MANOVA, hiệu ứng đa biến là SSCPerror^(-1)SSCPdifferencema trận (tổng hiệp phương sai và trong các nhóm chiếm). Nhưng vì có một số giá trị riêng trong đó có thể được "kết hợp" không theo một cách duy nhất trong một thống kê kiểm tra, nên có một số giả thuyết thay thế có thể tồn tại. Nhiều sức mạnh hơn - phức tạp hơn về mặt lý thuyết.
ttnphns

@ttnphns, vâng, điều này hoàn toàn chính xác, nhưng tôi nghĩ không thay đổi thực tế rằng giả thuyết null là những gì tôi đã viết nó (và đó là những gì câu hỏi đã nói về). Dù sử dụng thống kê kiểm tra nào (Wilks / Roy / Pillai-Bartlett / Lawley-Hotelling), họ đang cố gắng kiểm tra giả thuyết khống tương tự. Tôi có thể mở rộng câu trả lời của mình sau để thảo luận chi tiết hơn.
amip nói phục hồi Monica

1
@gung đã yêu cầu tôi bấm chuông (không hiểu tại sao ... Tôi đã dạy MANOVA khoảng 7 năm trước và không bao giờ áp dụng nó) - Tôi sẽ nói rằng amip nói đúng rằng là sự phủ định hoàn toàn của null , mà là một Hyperspace chiều trong không gian chiều của thông số (nếu là chiều mà không ai làm phiền quy định cho đến nay) . Và nó là tùy chọn 1 được đưa ra bởi OP. Phương án 2 khó kiểm tra hơn. H 0 : μ nhóm  1 = ... = μ nhóm  k p k p pH1H0:μgroup 1==μgroup kpkpp
StasK

8

Nó là cái trước

Tuy nhiên, cách nó không thực sự theo nghĩa đen để so sánh phương tiện của từng biến ban đầu. Thay vào đó, các biến trả lời được biến đổi tuyến tính theo cách rất giống với phân tích thành phần chính . (Có một chủ đề tuyệt vời về PCA ở đây: Ý nghĩa của phân tích thành phần chính, hàm riêng & giá trị riêng .) Sự khác biệt là PCA định hướng các trục của bạn để phù hợp với các hướng biến đổi tối đa, trong khi MANOVA xoay trục của bạn theo các hướng mà tối đa hóa việc tách các nhóm của bạn.

Mặc dù vậy, rõ ràng, không có thử nghiệm nào liên quan đến MANOVA đang thử nghiệm tất cả các phương tiện theo nghĩa trực tiếp, với phương tiện trong không gian ban đầu hoặc trong không gian được chuyển đổi. Có một số thống kê kiểm tra khác nhau rằng mỗi công việc theo một cách hơi khác nhau, dù sao chúng có xu hướng hoạt động trên các giá trị riêng của sự phân hủy làm biến đổi không gian. Nhưng theo như bản chất của giả thuyết null, đó là tất cả các phương tiện của tất cả các nhóm đều giống nhau trên mỗi biến trả lời, không phải chúng có thể khác nhau trên một số biến mà giống nhau trên ít nhất một biến.


Ôi ... Vậy Manova thực hiện phân tích phân biệt tuyến tính (để tối đa hóa khoảng cách giữa giá trị trung bình của các nhóm) và sau đó, nó chạy một anova tiêu chuẩn sử dụng trục đầu tiên làm biến phản ứng? Vì vậy, là "phương tiện - theo thuật ngữ của PC1 - của tất cả các nhóm là như nhau". Có đúng không? Ho
Remi.b

Có một số thử nghiệm khác nhau có thể. Chỉ kiểm tra trục thứ nhất về cơ bản là sử dụng gốc lớn nhất của Roy làm thử nghiệm của bạn. Đây thường sẽ là thử nghiệm mạnh mẽ nhất, nhưng nó cũng hạn chế hơn. Tôi tập hợp có một cuộc thảo luận đang diễn ra về thử nghiệm nào là 'tốt nhất'.
gung - Phục hồi Monica

Tôi đoán chúng tôi sử dụng MANOVA chứ không phải một số ANOVA để tránh nhiều vấn đề thử nghiệm. Nhưng nếu, bằng cách thực hiện MANOVA, chúng ta chỉ cần tạo ANOVA trên PC1 của LDR , thì chúng ta vẫn có một vấn đề thử nghiệm để xem xét khi xem xét Pvalue. Thê nay đung không? (Hy vọng điều đó có ý nghĩa hơn. Tôi đã xóa nhận xét không rõ ràng trước đây của mình)
Remi.b

Đó là một điểm sâu sắc, nhưng có hai vấn đề: 1) các trục hiện đang trực giao và có thể thay đổi các vấn đề với nhiều thử nghiệm; 2) các phân phối lấy mẫu của thống kê kiểm tra MANOVA có tính đến nhiều trục.
gung - Phục hồi Monica

1
@ Remi.b: Đây là những câu hỏi hay, nhưng chỉ cần rõ ràng: MANOVA không tương đương với ANOVA trên trục phân biệt đối xử đầu tiên của LDA! Xem ở đây để biết mối quan hệ giữa MANOVA và LDA: MANOVA liên quan đến LDA như thế nào?
amip nói rằng Phục hồi Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.