Cái mà chúng tôi gọi là hack P đang áp dụng thử nghiệm ý nghĩa nhiều lần và chỉ báo cáo kết quả quan trọng. Cho dù điều này là tốt hay xấu là tùy thuộc vào tình huống.
Để giải thích, chúng ta hãy nghĩ về các hiệu ứng thực sự theo thuật ngữ Bayes, thay vì các giả thuyết không và thay thế. Miễn là chúng tôi tin rằng tác động của lợi ích của chúng tôi đến từ một phân phối liên tục, thì chúng tôi biết giả thuyết null là sai. Tuy nhiên, trong trường hợp thử nghiệm hai mặt, chúng tôi không biết liệu đó là dương tính hay âm tính. Dưới ánh sáng này, chúng ta có thể nghĩ về giá trị p cho các thử nghiệm hai mặt như một thước đo xem mức độ mạnh mẽ của bằng chứng là ước tính của chúng ta có hướng chính xác (nghĩa là hiệu ứng dương hay âm).
p < a
Bây giờ, hãy xem xét những gì xảy ra khi bạn tiếp tục quay lại để lấy thêm dữ liệu. Mỗi khi bạn nhận được nhiều dữ liệu hơn, xác suất của bạn có được hướng chính xác có điều kiện trên dữ liệu đủ chỉ tăng lên. Vì vậy, trong kịch bản này, chúng ta nên nhận ra rằng bằng cách lấy thêm dữ liệu, mặc dù trên thực tế chúng ta đang tăng xác suất xảy ra lỗi loại I, chúng ta cũng đang giảm xác suất kết luận sai hướng.
Ngược lại, việc lạm dụng P-hack điển hình hơn; chúng tôi kiểm tra 100 kích thước hiệu ứng có xác suất rất nhỏ và chỉ báo cáo những kích thước quan trọng. Lưu ý rằng trong trường hợp này, nếu tất cả các hiệu ứng là nhỏ, chúng tôi có gần 50% cơ hội nhận sai hướng khi chúng tôi tuyên bố ý nghĩa.
Tất nhiên, giá trị p được tạo ra từ dữ liệu này - tăng gấp đôi vẫn phải đi kèm với một hạt muối. Mặc dù, nói chung, bạn không nên gặp vấn đề với những người thu thập nhiều dữ liệu để chắc chắn hơn về kích thước hiệu ứng, điều này có thể bị lạm dụng theo những cách khác. Ví dụ, một PI thông minh có thể nhận ra rằng thay vì thu thập tất cả 100 điểm dữ liệu cùng một lúc, họ có thể tiết kiệm một loạt tiền và tăng sức mạnh bằng cách trước tiên thu thập 50 điểm dữ liệu, phân tích dữ liệu và sau đó thu thập 50 điểm tiếp theo nếu không đáng kể . Trong kịch bản này, chúng làm tăng xác suất nhận được hướng của hiệu ứng sai điều kiện khi khai báo ý nghĩa, vì chúng có nhiều khả năng nhận được hướng của hiệu ứng sai với 50 điểm dữ liệu so với 100 điểm dữ liệu.
Và cuối cùng, hãy xem xét những tác động của việc không nhận được nhiều dữ liệu hơn khi chúng ta có một kết quả không đáng kể. Điều đó có nghĩa là không bao giờ thu thập thêm thông tin về chủ đề này, điều này sẽ không thực sự thúc đẩy khoa học tiến lên, phải không? Một nghiên cứu thiếu năng lực sẽ giết chết cả một lĩnh vực.