Loại bỏ các yếu tố khỏi bảng ANOVA 3 chiều


14

Trong một bài báo gần đây, tôi đã trang bị một mô hình hiệu ứng cố định ba chiều. Vì một trong những yếu tố không đáng kể (p> 0,1), tôi đã loại bỏ nó và chỉnh lại mô hình với hai hiệu ứng cố định và tương tác.

Tôi vừa có ý kiến ​​phản hồi, để trích dẫn:

Thời gian đó không phải là một yếu tố quan trọng trong ANOVA 3 chiều không phải là một tiêu chí đủ để tổng hợp yếu tố thời gian: văn bản tiêu chuẩn về vấn đề này, Underwood 1997, lập luận rằng giá trị p cho hiệu ứng không đáng kể phải là lớn hơn 0,25 trước khi mức độ điều trị của một yếu tố có thể được gộp lại. Các tác giả nên đưa ra giá trị p có liên quan ở đây và chứng minh sự hợp nhất của họ với tham chiếu đến Underwood 1997.

Câu hỏi của tôi là:

  1. Tôi chưa bao giờ nghe nói về quy tắc 0,25. Có ai khác không? Tôi có thể hiểu không loại bỏ yếu tố nếu giá trị p gần với mức giới hạn, nhưng để có một "quy tắc" có vẻ hơi cực đoan.
  2. Trọng tài này tuyên bố rằng Underwood 1997 là văn bản tiêu chuẩn. Có thật không? Tôi chưa bao giờ nghe nói về nó. Điều gì sẽ là văn bản tiêu chuẩn (một điều như vậy tồn tại)? Thật không may, tôi không có quyền truy cập vào Underwood, 1997 này.
  3. Mọi lời khuyên khi trả lời các trọng tài.

Bối cảnh: bài viết này đã được gửi đến một tạp chí phi thống kê. Khi lắp mô hình ba chiều tôi đã kiểm tra các hiệu ứng tương tác.


Chưa bao giờ nghe về sách giáo khoa của Underwood, nhưng bài viết này dường như thảo luận về những ưu và nhược điểm của việc gộp chung: Chủ nghĩa thực dụng của việc gộp chung trong các bảng ANOVA (Hines, Am. Stat. 1996). Bây giờ, tôi dường như nhớ rằng Sokal & Rohlf (1995) cũng khuyên bạn nên xem xét giá trị rất bảo thủ ( ); Tôi cần kiểm tra trước khi đăng câu trả lời, trừ khi có tài liệu tham khảo tốt hơn. p.25
chl

2
Chỉ là một nhận xét. Một hướng dẫn dựa trên có mùi giống như một sự lạm dụng của một p -giá trị, trong đó một tổ chức phi đáng kể p trị không phải là một biện pháp không bằng chứng. Vì giá trị p được phân phối đồng đều theo giả thuyết null, tại sao không chỉ lật một đồng xu (sai lệch)? Kết quả cuối cùng là như nhau, và ít nhất nó thành thật về việc trở thành dopey. (OK, dopey hơi mạnh, nhưng bạn hiểu ý.)psomethingppp

5
Đó sẽ là một câu trả lời thú vị cho một trọng tài: "Chúng tôi cảm ơn trọng tài vì những bình luận của họ, nhưng nghĩ rằng họ hơi dopey";) Mặc dù vậy, bình luận tốt.
csgillespie

Câu trả lời:


15

Tôi đoán Underwood trong câu hỏi là Thí nghiệm trong Sinh thái học (Cambridge Press 1991). Đây là một tài liệu tham khảo tiêu chuẩn ít nhiều trong các ngành khoa học sinh thái, có lẽ đứng thứ ba sau Zar và Sohkol và Rohlf (và theo tôi là 'dễ đọc' nhất trong ba)

Nếu bạn có thể tìm thấy một bản sao, phần có liên quan mà trọng tài của bạn trích dẫn là trong 9.7 trên tr.273. Ở đó Underwood đề xuất một quy trình gộp chung được đề xuất (vì vậy không phải là "quy tắc" mỗi lần ) cho các yếu tố không quan trọng. Đây là một quy trình gồm 2 bước mà tôi không hiểu lắm, nhưng kết quả cuối cùng là p = 0,25 được đề xuất để giảm xác suất lỗi Loại I khi gộp yếu tố không quan trọng (vì vậy không liên quan gì đến 'thời gian' trong ví dụ của bạn, nó có thể là bất kỳ yếu tố không phải sig nào).

Thủ tục không thực sự có vẻ là của Underwood, bản thân ông đã trích dẫn Winer et al 1991 ( Quy trình thống kê trong thiết kế thử nghiệm McGraw-Hill). Bạn có thể thử ở đó nếu bạn không thể tìm thấy một bản sao của Underwood.


4
+1 Câu trả lời hay: rõ ràng, chính xác, sâu sắc và có thẩm quyền.
whuber

@Chris, ý bạn là "giảm xác suất xảy ra lỗi Loại II" (không phải loại I) ở trên? Động lực của việc không loại bỏ các yếu tố khỏi mô hình là để ngăn chặn các nghiên cứu năng lượng thấp cho phép loại bỏ các nguyên nhân thực sự (nghĩa là Loại II kết luận biến không có tác dụng), đồng thời làm tăng hiệu ứng rõ ràng của các tham số trong mô hình nếu chúng có tương quan với biến bây giờ được loại bỏ. Vì hiệu ứng phụ sẽ tạo ra lỗi Loại I, có lẽ Underwood đang đề xuất để lại hiệu ứng để kiểm soát cả lỗi Loại 1 và Loại II, nghĩa là tối đa hóa hiệu lực của mô hình?
tim

10

Tôi ghê tởm các loại quy tắc dựa trên cắt này. Tôi nghĩ rằng nó phụ thuộc vào thiết kế và những gì bạn một tiên nghiệm giả thuyết và mong đợi được. Nếu bạn mong đợi kết quả thay đổi theo thời gian thì tôi sẽ nói bạn nên giữ thời gian, giống như bất kỳ yếu tố 'chặn' nào khác. Mặt khác, nếu bạn sao chép cùng một thí nghiệm vào các thời điểm khác nhau và không có lý do gì để nghĩ rằng kết quả sẽ thay đổi theo thời gian nhưng muốn kiểm tra xem đây là trường hợp nào, thì đã làm như vậy và tìm thấy rất ít hoặc không có bằng chứng nào cho thấy nó thay đổi với thời gian, tôi muốn nói rằng nó hoàn toàn hợp lý để sau đó giảm thời gian.

Tôi chưa bao giờ nghe nói về Underwood trước đây. Nó có thể là một văn bản chuẩn cho 'Thử nghiệm trong Sinh thái' (tiêu đề của cuốn sách), nhưng không có lý do rõ ràng rằng các thí nghiệm về sinh thái cần được điều trị bất kỳ khác nhau từ bất kỳ thí nghiệm khác trong lĩnh vực này, vì vậy để xem nó như là " các văn bản chuẩn trên vấn đề này "dường như không chính đáng.


1
Trước thí nghiệm, người ta tin rằng yếu tố này sẽ rất quan trọng. Tuy nhiên, nó đã bị ngập trong hai hiệu ứng khác. Tôi đã loại bỏ yếu tố này vì việc giữ nó không thay đổi kết luận và chỉ khiến cho việc giải thích khó khăn hơn.
csgillespie

2
Hmm, trong trường hợp đó tôi nghĩ rằng tôi sẽ giữ nó. Tôi không thể hiểu tại sao nó làm cho lời giải thích khó hơn, và khi bạn phát hiện ra có thể khó giải thích lý do tại sao bạn bỏ nó hơn là tại sao bạn giữ nó!
onestop

Tôi đưa ra quan điểm của bạn, mặc dù tôi không đồng ý 100% với nó. Tôi có thể dễ dàng thấy một trọng tài khác đề nghị bạn nên loại bỏ yếu tố này (đó là những gì các nhà thống kê sinh học khuyên rằng tôi cũng đã nói). Như bạn đã đề cập, khi đó là một khu vực màu xám, một quy tắc tùy ý không phải là hướng đi. Nếu chúng ta muốn đánh lạc hướng, chúng tôi sẽ không bao giờ đề cập rằng yếu tố khác đã từng tham gia! Hoàn toàn phi đạo đức, nhưng tôi nghi ngờ nó xảy ra.
csgillespie

1

xin vui lòng đọc văn bản của Underwood và tài liệu tham khảo trong đó, đó không phải là một quy tắc, xin vui lòng đọc. Trong thực tế, cách tiếp cận này là để kiểm soát lỗi loại II khi loại bỏ (hoặc gộp) một thuật ngữ "không đáng kể" trong mô hình. Điều gì xảy ra nếu thuật ngữ bạn xóa có mức ký hiệu là 0,06? Bạn có thực sự chắc chắn rằng MS dự kiến ​​không bao gồm hiệu ứng được thêm vào do yếu tố này không?. Nếu bạn loại bỏ thuật ngữ đó, bạn cho rằng MS dự kiến ​​không bao gồm hiệu ứng được thêm vào do cách xử lý đó NHƯNG BẠN PHẢI được bảo vệ phần nào trước lỗi loại II!. xin vui lòng tha thứ tiếng Anh nghèo và vội vàng của tôi!.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.