Tôi có nên bao gồm một đối số để yêu cầu tổng bình phương loại III trong ezANOVA không?


16

Tôi đã phát triển gói ez cho R như một phương tiện để giúp mọi người chuyển từ các gói thống kê như SPSS sang R. Điều này (hy vọng) đạt được bằng cách đơn giản hóa đặc điểm kỹ thuật của các hương vị khác nhau của ANOVA và cung cấp đầu ra giống như SPSS (bao gồm cả kích thước hiệu ứng và giả định kiểm tra), trong số các tính năng khác. Các ezANOVA()chức năng chủ yếu là phục vụ như là một wrapper để car::Anova(), nhưng phiên bản hiện tại của ezANOVA()cụ chỉ gõ-II tổng các bình phương, trong khi car::Anova()giấy phép đặc điểm kỹ thuật của một trong hai loại II hoặc -III tổng các bình phương. Như tôi có thể đã dự kiến, một số người dùng đã yêu cầu tôi cung cấp một đối số trongezANOVA()cho phép người dùng yêu cầu loại II hoặc loại III. Tôi đã thận trọng để làm như vậy và phác thảo lý do của tôi dưới đây, nhưng tôi sẽ đánh giá cao ý kiến ​​của cộng đồng về tôi hoặc bất kỳ lý do nào khác liên quan đến vấn đề này.

Các lý do không bao gồm đối số "SS_type" trong ezANOVA():

  1. Sự khác biệt giữa bình phương loại I, II và III chỉ tăng lên khi dữ liệu không cân bằng, trong trường hợp đó tôi muốn nói rằng có nhiều lợi ích hơn từ việc cải thiện sự mất cân bằng bằng cách thu thập dữ liệu hơn là thay đổi tính toán ANOVA.
  2. Sự khác biệt giữa loại II và III áp dụng cho các hiệu ứng bậc thấp có đủ điều kiện bằng hiệu ứng bậc cao hơn, trong trường hợp đó tôi cho rằng các hiệu ứng bậc thấp không quan tâm một cách khoa học. (Nhưng xem bên dưới để biết sự phức tạp có thể xảy ra của cuộc tranh luận)
  3. Đối với những trường hợp hiếm gặp khi (1) và (2) không áp dụng (khi không thể thu thập thêm dữ liệu và nhà nghiên cứu có mối quan tâm khoa học hợp lệ đối với hiệu ứng chính đủ điều kiện mà tôi hiện không thể tưởng tượng được), người ta có thể dễ dàng sửa đổi các ezANOVA()nguồn hoặc sử dụng car::Anova()riêng của mình để đạt được loại xét nghiệm III. Theo cách này, tôi thấy cần có thêm nỗ lực / hiểu biết để có được các bài kiểm tra loại III như một phương tiện để tôi có thể đảm bảo rằng chỉ những người thực sự biết họ đang làm gì đi theo con đường đó.

Bây giờ, người yêu cầu loại III gần đây nhất đã chỉ ra rằng đối số (2) bị hủy hoại bằng cách xem xét các trường hợp trong đó các hiệu ứng bậc cao còn "không đáng kể" có thể tính toán tổng của các bình phương cho các hiệu ứng bậc thấp hơn. Trong những trường hợp như vậy, có thể tưởng tượng rằng một nhà nghiên cứu sẽ nhìn vào hiệu ứng bậc cao hơn và thấy rằng nó là "không đáng kể", chuyển sang cố gắng giải thích các hiệu ứng bậc thấp, mà không biết đến nhà nghiên cứu, đã bị xâm phạm. Phản ứng ban đầu của tôi là đây không phải là vấn đề với tổng bình phương, mà với giá trị p và truyền thống kiểm tra giả thuyết null. Tôi nghi ngờ rằng một thước đo bằng chứng rõ ràng hơn, chẳng hạn như tỷ lệ khả năng, có thể có nhiều khả năng mang lại một bức tranh ít mơ hồ hơn về các mô hình được hỗ trợ phù hợp với dữ liệu. Tuy nhiên, tôi không biết


2
Một thời gian ngắn - có. Đơn giản chỉ cần cho phép sự nhất quán với các gói khác (ngay cả khi kết quả là "sai" theo một cách nào đó - trong trường hợp đó, một cảnh báo massage sẽ ổn). Và cảm ơn bạn cho gói tuyệt vời của bạn!
Tal Galili

Khi tôi viết "các gói", tôi có nghĩa là các gói thống kê khác (như SPSS và SAS) - Tôi rất vui vì những người khác đã lái xe về nhà sau đó tôi đã làm :)
Tal Galili

2
Như nhiều người đã biết, gói ez hiện tại (phiên bản 3) đã cập nhật ezANOVA, có đối số cho SS Type và trả về mô hình aov.
jiggysoo

Câu trả lời:


9

Chỉ để khuếch đại - tôi là người yêu cầu gần đây nhất, tôi tin.

Trong nhận xét cụ thể về quan điểm của Mike:

  1. Rõ ràng là sự khác biệt I / II / III chỉ áp dụng với các yếu tố dự đoán tương quan (trong đó các thiết kế không cân bằng là ví dụ phổ biến nhất, chắc chắn trong ANOVA trên thực tế) - nhưng dường như đây là một lập luận bác bỏ phân tích về tình huống không cân bằng (và do đó, bất kỳ cuộc tranh luận Loại I / II / III nào). Nó có thể không hoàn hảo, nhưng đó là cách mọi thứ xảy ra (và trong nhiều bối cảnh, chi phí cho việc thu thập dữ liệu tiếp theo lớn hơn vấn đề thống kê, hãy cẩn thận mặc dù vậy).

  2. Điều này là hoàn toàn công bằng và đại diện cho phần lớn các lý lẽ "II so với III, ủng hộ II" mà tôi đã gặp. Tóm tắt tốt nhất tôi gặp là Langsrud (2003) "ANOVA cho dữ liệu không cân bằng: Sử dụng loại II thay vì tổng bình phương loại III", Số liệu thống kê và tính toán 13: 163-167 (Tôi có bản PDF nếu khó tìm bản gốc ). Ông lập luận (lấy trường hợp hai yếu tố làm ví dụ cơ bản) rằng nếu có tương tác thì sẽ có tương tác, vì vậy việc xem xét các hiệu ứng chính thường là vô nghĩa (một điểm rõ ràng công bằng) - và nếu không có tương tác, phân tích Loại II về hiệu ứng chính mạnh hơn Loại III (chắc chắn), vì vậy bạn nên luôn luôn đi với Loại II. Tôi đã thấy các đối số khác (ví dụ: Venables,

  3. Và tôi đồng ý với điều này: nếu bạn có một sự tương tác nhưng cũng có một số câu hỏi về tác dụng chính, thì có lẽ bạn đang ở trong lãnh thổ tự làm.

Rõ ràng có những người chỉ muốn Loại III vì SPSS làm điều đó hoặc một số tài liệu tham khảo khác về Cơ quan cấp cao thống kê. Tôi không hoàn toàn phản đối quan điểm này, nếu có sự lựa chọn của nhiều người gắn bó với SPSS (mà tôi có một số điều chống lại, cụ thể là thời gian, tiền bạc và điều kiện hết hạn giấy phép) và Loại III SS, hoặc rất nhiều người chuyển sang R và Type III SS. Tuy nhiên, tranh luận này rõ ràng là một sự khập khiễng về mặt thống kê.

Tuy nhiên, lập luận mà tôi thấy khá có lợi cho Loại III là do độc lập của Myers & Well (2003, "Thiết kế nghiên cứu và phân tích thống kê", tr.328, 626-629) và Maxwell & Delaney (2004, " Thiết kế thí nghiệm và phân tích dữ liệu: Quan điểm so sánh mô hình ", trang 324-328, 332-335). Đó là như sau:

  • nếu có tương tác, tất cả các phương thức đều cho cùng một kết quả cho tổng bình phương tương tác
  • Loại II giả định rằng không có tương tác để thử nghiệm các hiệu ứng chính của nó; loại III không
  • Một số (ví dụ Langsrud) lập luận rằng nếu tương tác không đáng kể, thì bạn có lý khi cho rằng không có, và xem xét các hiệu ứng chính Loại II (mạnh hơn)
  • Nhưng nếu thử nghiệm về sự tương tác bị thiếu sức mạnh, nhưng vẫn có sự tương tác, thì sự tương tác có thể trở nên "không đáng kể" nhưng vẫn dẫn đến vi phạm các giả định của thử nghiệm hiệu ứng chính Loại II, thiên vị các thử nghiệm đó quá tự do .
  • Myers & Well trích dẫn Appelbaum / Cramer là những người đề xuất chính cho cách tiếp cận Loại II, và tiếp tục [p323]: "... Có thể sử dụng các tiêu chí bảo thủ hơn cho tính không tương tác của tương tác, như yêu cầu tương tác không đáng kể tại Ở mức 0,25, nhưng không đủ hiểu biết về hậu quả của ngay cả cách tiếp cận này. Theo nguyên tắc chung, không nên tính tổng các loại sqaures loại II trừ khi có lý do chính đáng để giả sử không có hiệu ứng tương tác và tương tác rõ ràng không rõ ràng Tổng bình phương." Họ trích dẫn [p629] Nhìn chung, Lee & Hornick 1981 như một minh chứng rằng các tương tác không đạt được ý nghĩa có thể kiểm tra sai lệch các tác động chính. Maxwell & Delaney [p334] ủng hộ cách tiếp cận Loại II nếu tương tác dân số bằng không, vì quyền lực, và cách tiếp cận Loại III nếu không phải là [vì tính dễ hiểu của các phương tiện xuất phát từ phương pháp này]. Họ cũng ủng hộ việc sử dụng Loại III trong tình huống thực tế (khi bạn đang suy luận về sự hiện diện của sự tương tác từ dữ liệu) do vấn đề tạo ra lỗi loại 2 [thiếu năng lực] trong thử nghiệm tương tác và do đó vô tình vi phạm các giả định của phương pháp SS loại II; sau đó họ đưa ra những điểm tương tự xa hơn với Myers & Well, và lưu ý cuộc tranh luận dài về vấn đề này! đang đưa ra những suy luận về sự hiện diện của sự tương tác từ dữ liệu) do vấn đề gây ra lỗi loại 2 [không đủ sức] trong thử nghiệm tương tác và do đó vô tình vi phạm các giả định của phương pháp SS loại II; sau đó họ đưa ra những điểm tương tự xa hơn với Myers & Well, và lưu ý cuộc tranh luận dài về vấn đề này! đang đưa ra những suy luận về sự hiện diện của sự tương tác từ dữ liệu) do vấn đề gây ra lỗi loại 2 [không đủ sức] trong thử nghiệm tương tác và do đó vô tình vi phạm các giả định của phương pháp SS loại II; sau đó họ đưa ra những điểm tương tự xa hơn với Myers & Well, và lưu ý cuộc tranh luận dài về vấn đề này!

Vì vậy, cách giải thích của tôi (và tôi không phải là chuyên gia!) Là có nhiều Cơ quan thống kê cao hơn ở cả hai phía của cuộc tranh luận; rằng các đối số thông thường đưa ra không phải là về tình huống thông thường sẽ phát sinh vấn đề (tình huống đó là một trong những diễn giải chung về diễn giải chính với sự tương tác không đáng kể); và rằng có những lý do hợp lý để lo ngại về cách tiếp cận Loại II trong tình huống đó (và nó đi xuống một sức mạnh so với điều chủ nghĩa tự do quá mức tiềm năng).

Đối với tôi, điều đó đủ để mong muốn tùy chọn Loại III trong ezANOVA, cũng như Loại II, bởi vì (đối với tiền của tôi), đó là một giao diện tuyệt vời cho các hệ thống ANOVA của R. R là một cách dễ sử dụng cho người mới, theo quan điểm của tôi và gói "ez", với ezANOVA và các hàm vẽ hiệu ứng khá đáng yêu, đi một chặng đường dài để R có thể tiếp cận được với đối tượng nghiên cứu tổng quát hơn. Một số suy nghĩ đang tiến triển của tôi (và một vụ hack khó chịu đối với ezANOVA) có tại http://www.psychol.cam.ac.uk/statistic/R/anova.html .

Sẽ được quan tâm để nghe suy nghĩ của mọi người!


Ah, tôi đã không nhận ra rằng sự phân biệt loại II / III xuất hiện bất cứ khi nào các yếu tố dự đoán tương quan, trong đó một thiết kế không cân bằng chỉ là một ví dụ. Điều này chắc chắn làm suy yếu thêm đối số "chỉ thu thập thêm dữ liệu" đầu tiên của tôi.
Mike Lawrence

2
Tôi khá bị thuyết phục bởi lập luận của bạn rằng R sẽ thu được nhiều chuyển đổi SPSS hơn nếu chúng được cung cấp các phương tiện dễ dàng để đạt được các phân tích quen thuộc, ngay cả khi các phân tích này đòi hỏi phải xem xét nhiều sắc thái hơn so với thông thường. Sau đó, một khi chúng ta đã nối chúng với R, chúng ta có thể cố gắng thuyết phục họ rằng cách tiếp cận quen thuộc không nhất thiết luôn là cách tiếp cận phù hợp. Tôi nghĩ rằng tôi vẫn sẽ đặt mặc định là loại = 2 với một cảnh báo lớn trong tài liệu rằng mặc định này có thể mang lại kết quả khác với SPSS và các liên kết thực hiện tài liệu về phân biệt loại II / III.
Mike Lawrence

Các biến thể khác trên các yếu tố dự đoán tương quan thường là với các yếu tố dự đoán liên tục, nhưng vâng, đó là vấn đề chung. // Điều đó nghe thật tuyệt với tôi! Đôi khi những thay đổi này là chậm; việc sử dụng các hiệu chỉnh hình cầu (thay vì bỏ qua vấn đề) là một điều mà tôi nghĩ rằng sự tiến bộ đã được thực hiện trong khoa học thần kinh. Đã có lúc bất kỳ đề cập nào về nó (đặc biệt nếu bạn báo cáo các df không chính xác, không chính xác) khiến các trọng tài nghĩ rằng bạn đang sủa.
Hồng y Rudolf

Tôi muốn nói thêm rằng các đối số Loại III là tất cả về các thử nghiệm giả thuyết bảo thủ hoặc tự do nhưng không phải về ý nghĩa của các thành phần. Một hiệu ứng chính trong Loại III không hợp lý vì nó bao gồm sự tương tác với các hiệu ứng chính bị thiếu. Bất kể các vấn đề thử nghiệm bảo thủ hay tự do, sự kết hợp mô hình cơ bản đều yêu cầu Loại II vì hiệu ứng chính Loại II có ý nghĩa. Điều đó nói rằng, ezANOVA nên có Loại III vì những lý do khác.
Giăng

7

Hãy cẩn thận: một câu trả lời hoàn toàn không thống kê. Tôi thích làm việc với một chức năng (hoặc ít nhất một gói) khi thực hiện cùng một loại phân tích (ví dụ: ANOVA). Cho đến nay, tôi luôn sử dụng Anova()vì tôi thích cú pháp của nó để chỉ định các mô hình với các biện pháp lặp lại - so với aov()và mất ít (SS loại I) với các biện pháp không lặp lại. ezANOVA()là tốt đẹp cho lợi ích bổ sung của kích thước hiệu ứng. Nhưng điều tôi đặc biệt không thích là phải xử lý 3 chức năng khác nhau để thực hiện cùng một kiểu phân tích, chỉ vì một trong số chúng thực hiện tính năng X (chứ không phải Y) và một chức năng Y khác (nhưng không phải X).

Đối với ANOVA, tôi có thể lựa chọn giữa oneway(), lm(), aov(), Anova(), ezANOVA(), và có lẽ những người khác. Khi dạy R, thật khó để giải thích các tùy chọn khác nhau, chúng liên quan với nhau như thế nào ( aov()là một trình bao bọc cho lm()) và chức năng nào thực hiện những gì:

  • oneway()chỉ cho các thiết kế yếu tố duy nhất nhưng với tùy chọn var.equal=FALSE. Không có tùy chọn như vậy trong aov()và những người khác, nhưng những chức năng đó cũng cho các thiết kế đa yếu tố.
  • cú pháp cho các biện pháp lặp đi lặp lại một chút phức tạp trong aov(), tốt hơn trongAnova()
  • tiện lợi loại SS tôi chỉ ở aov(), không ởAnova()
  • SS loại II và III tiện lợi chỉ có trong Anova(), không có trongaov()
  • biện pháp kích thước hiệu quả thuận tiện trong ezANOVA(), không phải ở người khác

Sẽ thật gọn gàng khi chỉ phải dạy một hàm với một cú pháp nhất quán làm tất cả. Nếu không có SS loại III tiện lợi, tôi ezANOVA()không thể là chức năng đó vì tôi biết rằng sinh viên sẽ được yêu cầu sử dụng chúng vào một lúc nào đó ("chỉ cần kiểm tra chéo những kết quả mà John Doe có được với SPSS"). Tôi cảm thấy tốt hơn khi có tùy chọn để tự mình lựa chọn mà không cần phải học thêm một cú pháp nào để chỉ định mô hình. Thái độ "Tôi biết những gì tốt nhất cho bạn" có thể có giá trị của nó, nhưng có thể được bảo vệ quá mức.


1
Để thêm một yêu cầu nữa: Sẽ thật tuyệt vời nếu chức năng cũng có thể chạy tất cả các loại tương phản từ ANOVA này, ví dụ, bằng cách sử dụng multcompgói (mà theo như tôi nhớ, yêu cầu aovcác đối tượng). Mặt khác, tôi đồng ý hoàn toàn và thường sử dụng ezcho nhiệm vụ hàng ngày của mình, vì nó rất dễ dàng ...
Henrik

1
thêm đối số "phương thức" (với các giá trị có thể là "oneway", "aov" và "Anova" và với đối số "..." để chuyển var.eq = FALSE sang oneway và gõ = 2 cho Anova) là một ý tưởng hấp dẫn, và dường như nó sẽ đủ dễ dàng để kết hợp. Cám ơn vì sự gợi ý.
Mike Lawrence

@Henrik: Tôi phải thành thật rằng sự hiểu biết về sự tương phản của tôi rất hạn chế và tôi không bao giờ sử dụng chúng trong nghiên cứu của mình, vì vậy tôi không ưu tiên kết hợp các tương phản vào ez.
Mike Lawrence

@Mike Nếu bạn có thể thêm đối số phương thức và do đó, hàm của bạn sẽ có thể trả về một aovphần tử sẽ rất tuyệt. Cho đến nay tôi thường lười biếng tạo ra aovyếu tố của riêng mình và sử dụng bạn ezANOVAthay vì với t.tests ...
Henrik

@ Giống như tôi đã không dám đề xuất một cái gì đó như thế vì đó là công việc của bạn mà bạn đang đặt vào. Cảm ơn vì điều đó! Các ezgói có một số tiềm năng to lớn: trong tâm lý học, nó đã được đề nghị khá thường xuyên (xem cuốn sách Đức "R für Einsteiger" bởi Luhmann). Làm cho nó thậm chí linh hoạt hơn chắc chắn sẽ được đánh giá cao.
caracal

2

Thế giới R không thích Type 3 SS nhiều.

Một trong những tài liệu tham khảo thường được trích dẫn là "Exegeses on linear Model" của Bill Venables (2000) .

Tôi hy vọng tôi không nhầm lẫn anh ta, nhưng tôi nghĩ lập luận chính của anh ta là SS loại 3 vi phạm nguyên tắc cận biên của các mô hình tuyến tính và do đó không hợp lý.


0

Đây là một cuộc tranh luận mở rộng về vấn đề loại II / III đối với tôi. Cảm ơn mọi người đã nỗ lực trong việc cung cấp các cuộc thảo luận. Tôi đã đi vòng quanh quan điểm thúc đẩy loại II nhất quán hơn loại III, nhưng có một sự hiểu biết yếu về tranh luận - Tôi chỉ dựa vào lời khuyên trong cuốn sách hồi quy (xe hơi) của John cáo rằng hiếm khi thử nghiệm loại III có thể hiểu được (tốt, tôi nghĩ rằng ông nói rằng ...).

Dù sao đi nữa, ezANOVA thực sự hữu ích trong việc cho phép truy cập vào chức năng R, điều mà không thể đối với sinh viên đại học mà tôi dạy trong tâm lý học. Tôi cung cấp các mô-đun R trực tuyến, một mô-đun có tính năng ezANOVA để trình diễn các thiết kế ANOVA hỗn hợp (mặc dù có vẻ như phiên bản trước 3 có thể đã bị lỗi cho ... doh!)

Dùng thử tại đây:

http://www.wessa.net/rwasp_Mixed%20Model%20ANOVA.wasp

sau khi tải mô-đun (~ 10 giây), hãy tìm nút tính toán (xuống nửa trang) và nó sẽ chạy ezANOVA và các bảng và sơ đồ liên quan.

Ian


Khi bạn nói rằng ez đã có lỗi với các thiết kế ANOVA hỗn hợp, bạn có dựa trên thông báo gần đây của tôi về phiên bản 3.0 không, trong đó tôi lưu ý rằng có một lỗi trong mã ezMixed ()? Nếu vậy, tôi nghĩ bạn giải thích sai lưu ý đó. ezMixed () không liên quan đến ezANOVA (). ezMixed () phục vụ để giúp đánh giá ảnh hưởng của các hiệu ứng cố định trong bối cảnh mô hình hóa hiệu ứng hỗn hợp.
Mike Lawrence

HI Mike - bạn hoàn toàn đúng - đó là ghi chú của bạn trên ezMixed () Tôi đã đọc và giải thích sai điều này cho ezANOVA ().
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.