Tôi đã đọc Bản sao p p giấy và của 2008 của Geoff Cumming : Các giá trị dự đoán tương lai một cách mơ hồ, nhưng khoảng tin cậy làm tốt hơn nhiều [~ 200 trích dẫn trong Google Scholar] - và bị nhầm lẫn bởi một trong những tuyên bố trung tâm của nó. Đây là một trong loạt bài báo mà Cumming lập luận chống lại giá trị và ủng hộ khoảng tin cậy; tuy nhiên, câu hỏi của tôi không phải là về cuộc tranh luận này và chỉ liên quan đến một yêu cầu cụ thể về giá trị .
Hãy để tôi trích dẫn từ bản tóm tắt:
Bài viết này cho thấy rằng, nếu một thử nghiệm ban đầu cho kết quả hai đuôi , có khả năng giá trị một đuôi từ một bản sao sẽ rơi vào khoảng , a cơ hội mà và hoàn toàn cơ hội mà . Đáng chú ý, khoảng cách giữa các dòng được gọi là một khoảng thời gian rộng, tuy nhiên kích thước mẫu này lớn.80 % p ( .00008 , .44 ) 10 % p < .00008 10 % p > .44 p
Cumming tuyên bố rằng " khoảng " này và trên thực tế là toàn bộ phân phối giá trị mà người ta sẽ có được khi sao chép thử nghiệm ban đầu (với cùng cỡ mẫu cố định), chỉ phụ thuộc vào -value và không phụ thuộc vào kích thước hiệu ứng thực, sức mạnh, cỡ mẫu hoặc bất cứ thứ gì khác:p p p o b t
[...] phân phối xác suất của có thể được lấy mà không cần biết hoặc giả sử giá trị cho (hoặc sức mạnh). [...] Chúng tôi không thừa nhận bất kỳ kiến thức nào trước đây về và chúng tôi chỉ sử dụng thông tin [quan sát sự khác biệt giữa các nhóm] đưa ra về làm cơ sở cho việc tính toán cho một của phân phối và của các khoảng .δ δ M d i f f δ p o b t p p
Tôi bối rối bởi điều này bởi vì đối với tôi, dường như việc phân phối giá trị phụ thuộc rất nhiều vào sức mạnh, trong khi bản thân không cung cấp bất kỳ thông tin nào về nó. Có thể là kích thước hiệu ứng thực sự là và sau đó phân phối là đồng nhất; hoặc có thể kích thước hiệu ứng thực sự là rất lớn và sau đó chúng ta nên mong đợi giá trị rất nhỏ . Tất nhiên người ta có thể bắt đầu với việc giả định một số kích thước hiệu ứng có thể có trước và tích hợp vào nó, nhưng Cumming dường như tuyên bố rằng đây không phải là điều anh ta đang làm.p o b t δ = 0 p
Câu hỏi: Chính xác thì chuyện gì đang xảy ra ở đây?
Lưu ý rằng chủ đề này có liên quan đến câu hỏi này: Phần nào của các thử nghiệm lặp lại sẽ có kích thước hiệu ứng trong khoảng tin cậy 95% của thử nghiệm đầu tiên? với một câu trả lời tuyệt vời của @whuber. Cumming có một bài viết về chủ đề này để: Cumming & Maillardet, 2006, Khoảng tin cậy và sao chép: Nơi tiếp theo sẽ có nghĩa là gì? - nhưng cái đó rõ ràng và không có gì khó hiểu.
Tôi cũng lưu ý rằng khiếu nại của Cumming được lặp đi lặp lại nhiều lần trong bài viết Phương pháp tự nhiên 2015 Giá trị thay đổi tạo ra kết quả không thể chấp nhận được mà một số bạn có thể đã gặp phải (nó đã có ~ 100 trích dẫn trong Google Scholar):
[...] sẽ có sự thay đổi đáng kể về giá trị của các thí nghiệm lặp lại. Trong thực tế, các thí nghiệm hiếm khi được lặp lại; chúng ta không biết tiếp theo có thể khác nhau như thế nào . Nhưng nó có khả năng là nó rất khác nhau. Ví dụ: bất kể sức mạnh thống kê của một thử nghiệm, nếu một bản sao duy nhất trả về giá trị , có khả năng một thử nghiệm lặp lại sẽ trả về giá trị trong khoảng từ đến (và thay đổi [sic] rằng sẽ còn lớn hơn nữa).P P 0,05 80 % P 0 0,44 20 % P
(Lưu ý, bằng cách này, bằng cách nào, bất kể tuyên bố của Cumming có đúng hay không, bài báo của Phương pháp Tự nhiên trích dẫn nó không chính xác: theo Cumming, chỉ có xác suất trên . Và vâng, bài báo có ghi "20% chan g e ". Pfff.)0,44