Khi nào và làm thế nào để tránh sử dụng thử nghiệm chính xác của Fisher


7

Ai đó có thể giải thích tại sao Richard McElreath nói rằng bài kiểm tra chính xác của Fisher hiếm khi được sử dụng một cách thích hợp trong cuốn sách giới thiệu xuất sắc Bayesian của ông ( Suy nghĩ lại thống kê )?

Để tham khảo, bối cảnh dưới đây:

Tại sao các bài kiểm tra không đủ cho nghiên cứu sáng tạo? Các thủ tục cổ điển của thống kê giới thiệu có xu hướng không linh hoạt và dễ vỡ. Theo tính không linh hoạt, ý tôi là họ có những cách rất hạn chế để thích nghi với bối cảnh nghiên cứu độc đáo. Bởi mong manh, ý tôi là họ thất bại theo những cách không thể đoán trước khi áp dụng vào bối cảnh mới. Vấn đề này, bởi vì ở ranh giới của hầu hết các ngành khoa học, hầu như không bao giờ rõ ràng thủ tục nào là phù hợp. Không có con golem truyền thống nào được đánh giá trong các thiết lập nghiên cứu mới, và do đó, thật khó để chọn một con và sau đó để hiểu cách nó hoạt động.Một ví dụ điển hình là thử nghiệm chính xác của Fisher, áp dụng (chính xác) cho bối cảnh thực nghiệm cực kỳ hẹp, nhưng thường được sử dụng bất cứ khi nào số lượng tế bào nhỏ. Cá nhân tôi đã đọc hàng trăm cách sử dụng thử nghiệm chính xác của Fisher trên các tạp chí khoa học, nhưng ngoài việc sử dụng ban đầu của Fisher, tôi chưa bao giờ thấy nó được sử dụng một cách thích hợp. Ngay cả một thủ tục như hồi quy tuyến tính thông thường, khá linh hoạt theo nhiều cách, có thể mã hóa một lượng lớn các giả thuyết thú vị, đôi khi rất mong manh. Ví dụ, nếu có lỗi đo lường đáng kể trên các biến dự đoán, thì quy trình có thể thất bại theo những cách ngoạn mục. Nhưng quan trọng hơn, gần như luôn luôn có thể làm tốt hơn hồi quy tuyến tính thông thường, phần lớn là do một hiện tượng được gọi là quá mức.


3
Xem số liệu thống kê.stackexchange.com/q/136584/17230 . Khi thử nghiệm chính xác của Fisher là phù hợp gây tranh cãi - chắc chắn đã có tranh luận kể từ khi Fisher đưa ra.
Scortchi - Phục hồi Monica

1
Một tổng quan tuyệt vời và gần đây về chủ đề này và những tranh cãi được đưa ra bởi Choi et al. (2015): Làm sáng tỏ nền tảng của suy luận thống kê với các bảng 2x2 .
COOLSerdash

1
@COOLSerdash: Đó là một phát hiện tuyệt vời, và chứa câu trả lời tôi muốn viết, giải phóng khỏi những ràng buộc về thời gian & sức mạnh não bộ; và nhiều hơn nữa bên cạnh. Ngoài ra tất cả hoặc hầu hết các tài liệu tham khảo tôi muốn cung cấp; Tôi sẽ có một cái nhìn để xem nếu tôi có thêm & thêm chúng vào câu trả lời của tôi.
Scortchi - Phục hồi Monica

Câu trả lời:


8

Thật khó để đọc trích dẫn này và không phỏng đoán rằng tác giả coi đó chỉ là một sai lầm khi sử dụng Thử nghiệm chính xác của Fisher khi tổng số biên của bảng dự phòng không được thiết kế cố định. "Công dụng ban đầu của Fisher" trong bài kiểm tra phải nói đến người phụ nữ nếm trà nổi tiếng "đã được nói trước về những gì bài kiểm tra sẽ bao gồm, cụ thể là cô ấy sẽ được yêu cầu nếm tám cốc, mỗi ly sẽ là bốn ly, [...] "(Fisher (1935), Thiết kế thí nghiệm ); & sau đó "một bối cảnh thực nghiệm cực kỳ hẹp" phân tích thành "sơ đồ lấy mẫu áp dụng cho một số nghiên cứu được thực hiện trong thực tế".

Nhưng đó không phải là một sai lầm: dựa trên thống kê đủ để phân phối dữ liệu theo giả thuyết null là một kỹ thuật tiêu chuẩn để loại bỏ các tham số phiền toái và đưa ra các thử nghiệm về kích thước chính xác (đó là cơ sở của các thử nghiệm hoán vị). Tổng số biên chứa rất ít thông tin mà bạn có thể sử dụng để ước tính tham số quan tâm, tỷ lệ chênh lệch; & đúng hơn rất nhiều về độ chính xác mà bạn có thể ước tính được: đối số là không gian mẫu thu được từ điều hòa trên cả hai có liên quan nhiều hơn đến suy luận so với điều kiện thu được chỉ bằng một điều kiện, hoặc chỉ trên tổng số đếm. Đó là một không gian mẫu thô khủng khiếp, tuy nhiên, dẫn đến việc mất điện. Làm thế nào nên liên quan của không gian mẫu được cân bằng chống mất thông tin? Bao nhiêu độ thô của không gian mẫu có thể được chấp nhận trước khi một phép thử không có triệu chứng hoặc một thử nghiệm vô điều kiện được ưu tiên? Đây là những câu hỏi bực tức, và việc phân tích các bảng dự phòng hai nhân hai đã gây tranh cãi trong nửa thế kỷ trở lên.

Cho rằng điều này xuất phát từ một văn bản Bayes, tôi nghĩ rằng tác giả đã bỏ lỡ một cơ hội để chọc cười những vấn đề nan giải, một cam kết sử dụng các phương pháp thường xuyên có thể dẫn đến việc giật gân như Jaynes trong Lý thuyết Xác suất: Logic của Khoa học

Trong một bài báo xuất bản cùng năm với cuốn sách của mình, ông đã sử dụng một ví dụ trong đó, mặc dù sơ đồ lấy mẫu không được đưa ra rõ ràng, nhiều nhất một lề có thể đã được sửa trước, và rất có thể chỉ là tổng số đã được sửa. Cặp song sinh giống tình dục của tội phạm bị kết án được phân loại là đơn nhân so với chóng mặt & như bị kết án về tội ác so với không bị kết án trong một bảng hai (hai (1935), "Logic của suy luận quy nạp", JRSS, 98 , 1, Trang 39 bóng82). [Chỉnh sửa: Dữ liệu đến từ Lange (1929), Verbrechen als Schicksal: Studien am kriminellen Zwillingen . Wetzell (2000), Phát minh ra tội phạm: Lịch sử tội phạm học Đức, 1880 Tiết1945 , trang 162] mô tả quy trình thu thập dữ liệu của Lange; nó '

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.