Có phải LSD của Fisher tệ như họ nói không?


22

Khi chúng tôi thực hiện các thí nghiệm (trên các cỡ mẫu nhỏ (thường là cỡ mẫu trên mỗi nhóm xử lý khoảng 7 ~ 8)) trên hai nhóm, chúng tôi sử dụng thử nghiệm t để kiểm tra sự khác biệt. Tuy nhiên, khi chúng tôi thực hiện ANOVA (rõ ràng là cho hơn hai nhóm), chúng tôi sử dụng một cái gì đó dọc theo dòng Bonferroni (LSD / # so sánh theo cặp) hoặc Tukey như một bài đăng, và khi còn là học sinh, tôi đã được cảnh báo từ sử dụng sự khác biệt nhỏ nhất của Fisher (LSD).

Bây giờ vấn đề là, LSD tương tự như kiểm tra cặp đôi (tôi có đúng không?), Và điều duy nhất nó không giải thích là chúng tôi đang thực hiện nhiều so sánh. Làm thế nào quan trọng là khi giao dịch với 6 nhóm nói, nếu ANOVA là đáng kể?

Hay nói cách khác, có bất kỳ lý do khoa học / thống kê nào cho việc sử dụng LSD của Fisher không?


1
Bạn có thể làm rõ ' họ ' là ai và bao gồm các ví dụ về những gì họ nói không? (Họ nói nó tệ đến mức nào? Hãy nói rõ những gì chúng ta đang thảo luận ở đây.) Tôi đã thấy một số lời chỉ trích về LSD, một số điều hợp lý, nhưng tôi không biết rằng tôi đã thấy những gì bạn đã nhìn thấy, cũng không phải là những gì tôi đã thấy sẽ đòi hỏi khá nhiều đặc tính bạn có ở đó.
Glen_b -Reinstate Monica

+1 nếu bạn đến đây cố gắng tìm hiểu trang web trao đổi ngăn xếp nào nói về Timothy Learys LSD
PW Kad

@Glen_b Họ đề cập đến các nhà khoa học trong khoa học y sinh. Những lời của giáo sư của tôi là, để trích dẫn "Sử dụng Bonferroni hoặc Tukey. Chỉ sử dụng LSD trong tuyệt vọng. Nếu điều đó không có ích, hãy sử dụng LSD khác :)"
Rover Eye

Câu trả lời:


10

LSD của Fisher thực sự là một loạt các thử nghiệm t cặp, với mỗi thử nghiệm sử dụng sai số bình phương trung bình từ ANOVA đáng kể như ước tính phương sai gộp của nó (và tự nhiên lấy các mức độ tự do liên quan). ANOVA có ý nghĩa là một hạn chế bổ sung của thử nghiệm này.

Nó hạn chế tỷ lệ lỗi thông minh của gia đình đối với alpha trong trường hợp đặc biệt chỉ có 3 nhóm. Howell có một lời giải thích rất hay và tương đối đơn giản về cách thức thực hiện trong Chương 16 của cuốn sách Thống kê cơ bản cho Khoa học hành vi, ấn bản thứ 8, David C. Howell .

Trên 3 nhóm alpha tăng nhanh (như @Alexis đã lưu ý ở trên). Nó không chắc chắn thích hợp cho 6 nhóm. Tôi tin rằng chính khả năng ứng dụng hạn chế này khiến hầu hết mọi người đề nghị bỏ qua nó như một lựa chọn.


18

Làm thế nào quan trọng là nhiều so sánh khi giao dịch với 6 nhóm? Chà ... với sáu nhóm bạn đang giao dịch với tối đa bàiso sánhcó thểso sánh theo cặp. Tôi sẽ để Randall Munroe không thể đánh giá được tầm quan trọng của nhiều so sánh:6(61)2=15

nhập mô tả hình ảnh ở đây

tôi sẽ nói thêm rằng, như trong câu mở đầu của bạn, bạn đề nghị rằng đôi khi bạn có bảy nhóm, thì số lượng bài kiểm tra cặp bài tối đa là 7(71)2=21 quá giống với kịch bản Jellybean vừa trình bày (mà cũng trình bày 21 bài kiểm tra;). Vì vậy, thực sự, trừ khi bạn muốn thế giới chế giễu bạn bằng cách liên tục gửi cho bạn các bản sao của xkcd 882 , tôi sẽ tiếp tục thực hiện nhiều điều chỉnh so sánh (như FWER, như Bonferroni hoặc Holm-Sidak , hoặc FDR như Stewamini và Hochberg ) .


1
Điểm cũng được thực hiện. Tuy nhiên, điều này không đặt ra câu hỏi, rằng nếu chúng ta có rất ít nhóm (giả sử 3 (3 cặp) hoặc 4 (6 cặp) thì khả năng tìm thấy giá trị đáng kể do tình cờ là thấp? (một lần nữa, LSD được bảo vệ bởi tầm quan trọng của ANOVA)
Rover Eye

2
α

2
@Rover Có 6 bài kiểm tra theo cặp mà tất cả đều vượt qua với p> 0,05 đã có nghĩa là bạn hiện có p> 0,26, đó là một thay đổi khá quan trọng.
Voo

Tôi không hỏi sau bất cứ điều gì thiết thực, chỉ là trầm ngâm. Nhưng quan điểm của bạn được thực hiện tốt. @Voo đúng, lỗi có xu hướng nhân lên. Cảm ơn cả hai.
Rover Eye

10

Bài kiểm tra của Fisher cũng tệ như mọi người nói, đó là từ quan điểm của Neyman-Pearson và nếu bạn làm theo những gì câu hỏi của bạn ngụ ý --- sau một bài kiểm tra ANOVA quan trọng cho mỗi sự khác biệt. Bạn có thể thấy điều này trong nhiều bài báo được xuất bản . Nhưng, kiểm tra tất cả sự khác biệt sau ANOVA, hoặc bất kỳ trong số chúng, là không cần thiết cũng không được khuyến nghị. Và, thử nghiệm của Fisher không được chế tạo theo lý thuyết suy luận thống kê của Neyman-Pearson.

Điều quan trọng cần ghi nhớ là, khi Fisher đề xuất LSD, anh ấy đã không thực sự coi nhiều thử nghiệm là một vấn đề quan trọng bởi vì anh ấy đã không coi việc cắt giảm ý nghĩa là một quy tắc cứng và nhanh để quyết định liệu kết quả có quan trọng hay không. Người ta có thể xây dựng một LSD như một cách dễ dàng để kiểm tra dữ liệu về nơi có thể có kết quả quan trọng nhưng không phải là trọng tài của những gì có ý nghĩa. Hãy nhớ rằng, chính Fisher đã nói rằng bạn chỉ nên chạy nhiều môn hơn nếu p > 0,05.

Và tại sao bạn nghĩ rằng thử nghiệm mọi thứ là một ý tưởng tốt? Xem xét lý do tại sao bạn chạy ANOVA ở nơi đầu tiên. Bạn có thể được dạy rằng đó là vì việc chạy nhiều bài kiểm tra t có vấn đề, vì bạn thân mật trong câu hỏi của mình. Vậy thì tại sao bạn lại chạy chúng, hoặc tương đương với chúng sau đó? Tôi biết điều đó xảy ra nhưng tôi chưa bao giờ cần phải chạy thử sau ANOVA. Một ANOVA cho bạn biết rằng mẫu dữ liệu của bạn không phải là một tập hợp các giá trị bằng nhau, có thể có một số ý nghĩa trong đó. Nhiều người bị treo lên vì cảnh báo rằng bài kiểm tra không cho bạn biết các bit có ý nghĩa ở đâu nhưng họ quên rằng dữ liệu và lý thuyết cho bạn biết điều đó.


Cảm ơn các giấy tờ. bạn đặt ra một câu hỏi là tại sao mọi người sử dụng một bài hậu hoc sau ANOVA. Nói thật với bạn, tôi thực sự không biết. Tôi đã nói rằng ANOVA là một thử nghiệm blob và như bạn đã đề cập, chúng tôi cần tìm ra tầm quan trọng nằm ở đâu. Và thành thật mà nói, tôi muốn biết làm thế nào bạn chỉ báo cáo ANOVA.
Rover Eye

1
Đưa cho tôi mẫu dữ liệu và tôi sẽ cho bạn biết cách tôi báo cáo ANOVA. Phiên bản ngắn là bạn mô tả dữ liệu. Các mục rất gần nhau sẽ được nhóm lại trong phần mô tả và các mục cách xa nhau được coi là sự khác biệt có ý nghĩa (nhưng tất cả đều tương đối). Giả sử tôi có A = 20, B = 58, C = 61, p = 0,03. Tôi đã báo cáo thống kê và nói rằng A thấp hơn B và C, tương tự nhau. Vì vậy, tất cả phụ thuộc vào dữ liệu. Tôi có thể tưởng tượng một chuỗi các mục hơi rắc rối, (A = 10, B = 20, C = 30) theo một số cách suy luận nhưng có lẽ tôi nên thực hiện hồi quy.
John

Đó là một cách khá thú vị để báo cáo ANOVA và tôi có thể thấy những gì bạn đang nhận được. Mặc dù tôi chắc chắn có thể thảo luận điều này với các giám sát viên của mình, tôi không chắc chắn liệu họ có muốn phá vỡ "định mức" báo cáo ANOVA mà không cần posthoc hay không. Cố gắng tìm các ấn phẩm khoa học đã báo cáo bằng phương pháp này.
Rover Eye

2
Một cái gì đó có ý nghĩa trong dữ liệu. Thường thì đó là điều hiển nhiên. Làm một bài hoc để chứng minh điều hiển nhiên chỉ chứng tỏ bạn không biết ANOVA làm gì ở nơi đầu tiên.
Giăng

6

Lý do đằng sau LSD của Fisher có thể được mở rộng cho các trường hợp vượt quá N = 3.

Tôi sẽ thảo luận chi tiết về trường hợp của bốn nhóm. Để giữ tỷ lệ lỗi Loại I theo gia đình ở mức 0,05 trở xuống, hệ số hiệu chỉnh đa so sánh là 3 (tức là hệ số alpha so sánh 0,05 / 3) đủ, mặc dù có sáu so sánh sau hoc giữa bốn nhóm. Điều này là do:

  • trong trường hợp tất cả bốn phương tiện thực sự đều bằng nhau, omnibus Anova trong bốn nhóm giới hạn tỷ lệ lỗi theo gia đình là 0,05;
  • trong trường hợp ba trong số các phương tiện thực sự bằng nhau và thứ tư khác với chúng, chỉ có ba so sánh có khả năng gây ra lỗi Loại I;
  • trong trường hợp hai trong số các phương tiện thực sự bằng nhau và khác với hai phương tiện còn lại bằng nhau, chỉ có hai so sánh có khả năng gây ra lỗi Loại I.

Điều này làm cạn kiệt các khả năng. Trong mọi trường hợp, xác suất tìm thấy một hoặc nhiều p dưới 0,05 đối với các nhóm có phương tiện thực sự bằng nhau, duy trì ở mức hoặc dưới 0,05 nếu hệ số hiệu chỉnh cho nhiều so sánh là 3 và đây là định nghĩa về tỷ lệ lỗi theo gia đình.

Lý do này cho bốn nhóm là một khái quát từ lời giải thích của Fisher cho phương pháp khác biệt tối thiểu ba nhóm của ông. Đối với các nhóm N , hệ số hiệu chỉnh, nếu phép thử Anova omnibus có ý nghĩa, là ( N -1) ( N -2) / 2. Vì vậy, hiệu chỉnh Bonferroni, theo hệ số N ( N -1) / 2, quá mạnh. Nó đủ để sử dụng hệ số hiệu chỉnh alpha là 1 cho N = 3 (đây là lý do tại sao LSD của Fisher hoạt động với N = 3), hệ số 3 cho N = 4, hệ số 6 cho N = 5, hệ số 10 cho N = 6, v.v.


+1. Đây là một bổ sung rất tốt cho chủ đề. Chào mừng đến với trang web!
amip nói rằng Phục hồi lại

Mỗi tình huống bạn mô tả không yêu cầu bất kỳ bài kiểm tra hoc.
Giăng

1
Bạn có thể chỉ ra một tài liệu tham khảo cho (N-1)(N-2)/2kết quả?
rvl
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.