Tôi đã đọc các giá trị , tỷ lệ lỗi loại 1, mức ý nghĩa, tính toán công suất, kích thước hiệu ứng và cuộc tranh luận giữa Fisher và Neyman-Pearson. Điều này đã khiến tôi cảm thấy một chút choáng ngợp. Tôi xin lỗi về bức tường văn bản, nhưng tôi cảm thấy cần phải cung cấp một cái nhìn tổng quan về sự hiểu biết hiện tại của tôi về các khái niệm này, trước khi tôi chuyển sang các câu hỏi thực tế của mình.
Từ những gì tôi đã thu thập được, giá trị chỉ đơn giản là thước đo của sự bất ngờ, xác suất đạt được kết quả ít nhất là cực đoan, cho rằng giả thuyết null là đúng. Fisher ban đầu dự định cho nó là một biện pháp liên tục.
Trong khung Neyman-Pearson, bạn chọn trước một mức ý nghĩa và sử dụng mức này làm điểm cắt (tùy ý). Mức ý nghĩa bằng tỷ lệ lỗi loại 1. Nó được xác định bởi tần số chạy dài, tức là nếu bạn lặp lại một thử nghiệm 1000 lần và giả thuyết khống là đúng, khoảng 50 trong số các thử nghiệm đó sẽ dẫn đến một hiệu ứng đáng kể , do tính biến thiên của mẫu. Bằng cách chọn một mức ý nghĩa, chúng tôi đang tự bảo vệ mình trước những tích cực sai lầm này với một xác suất nhất định. -values theo truyền thống không xuất hiện trong khung này.
Nếu chúng ta tìm thấy giá trị là 0,01 thì điều này không có nghĩa là tỷ lệ lỗi loại 1 là 0,01, lỗi loại 1 được nêu là tiên nghiệm. Tôi tin rằng đây là một trong những tranh luận chính trong cuộc tranh luận giữa Fisher và NP, bởi vì giá trị thường được báo cáo là 0,05 *, 0,01 **, 0,001 ***. Điều này có thể khiến mọi người hiểu lầm rằng hiệu ứng này rất có ý nghĩa ở một giá trị nhất định , thay vì ở một giá trị quan trọng nhất định.
Tôi cũng nhận ra rằng giá trị là một hàm của cỡ mẫu. Do đó, nó không thể được sử dụng như một phép đo tuyệt đối. Một giá trị nhỏ có thể chỉ ra một hiệu ứng nhỏ, không liên quan trong một thí nghiệm mẫu lớn. Để chống lại điều này, điều quan trọng là phải thực hiện tính toán kích thước công suất / hiệu ứng khi xác định kích thước mẫu cho thử nghiệm của bạn. cho chúng ta biết liệu có ảnh hưởng hay không, nó lớn đến mức nào. Xem Sullivan 2012 .
Câu hỏi của tôi: Làm thế nào tôi có thể điều hòa sự thật rằng giá trị là thước đo của sự bất ngờ (nhỏ hơn = thuyết phục hơn) trong khi đồng thời nó không thể được xem là một phép đo tuyệt đối?
Điều tôi bối rối là, như sau: chúng ta có thể tự tin hơn vào một giá trị nhỏ hơn một giá trị lớn không? Theo nghĩa của Ngư dân, tôi sẽ nói có, chúng tôi ngạc nhiên hơn. Trong khung NP, việc chọn mức ý nghĩa nhỏ hơn có nghĩa là chúng ta đang tự bảo vệ mình mạnh mẽ hơn trước những kết quả sai.
Nhưng mặt khác, giá trị phụ thuộc vào kích thước mẫu. Họ không phải là một biện pháp tuyệt đối. Do đó, chúng ta không thể đơn giản nói 0,001593 có ý nghĩa hơn 0,0439. Tuy nhiên, đây là những gì sẽ được ngụ ý trong khuôn khổ của Fisher: chúng ta sẽ ngạc nhiên hơn với một giá trị cực đoan như vậy. Thậm chí còn có cuộc thảo luận về thuật ngữ rất có ý nghĩa là một cách hiểu sai: Có sai không khi coi kết quả là "rất có ý nghĩa"?
Tôi đã nghe nói rằng giá trị trong một số lĩnh vực khoa học chỉ được coi là quan trọng khi chúng nhỏ hơn 0,0001, trong khi ở các lĩnh vực khác, giá trị khoảng 0,01 đã được coi là rất có ý nghĩa.
Câu hỏi liên quan: