Trên thực tế, giá trị p cuối cùng cũng đã lỗi thời: http://www.nature.com/news/psychology-journal-bans-p-values-1.17001 . Thử nghiệm ý nghĩa giả thuyết Null (NHST) tạo ra ít hơn một mô tả về cỡ mẫu của bạn. (*) Bất kỳ can thiệp thử nghiệm nào cũng sẽ có một số ảnh hưởng, có nghĩa là giả thuyết null đơn giản về 'không ảnh hưởng' luôn sai theo nghĩa nghiêm ngặt . Do đó, thử nghiệm 'không đáng kể' chỉ đơn giản có nghĩa là cỡ mẫu của bạn không đủ lớn; một bài kiểm tra 'đáng kể' có nghĩa là bạn đã thu thập đủ dữ liệu để 'tìm' thứ gì đó.
"Kích thước hiệu ứng" thể hiện nỗ lực khắc phục điều này, bằng cách đưa ra một biện pháp theo thang đo tự nhiên của vấn đề. Trong y học, nơi các phương pháp điều trị luôn có một số hiệu quả (ngay cả khi đó là hiệu ứng giả dược), khái niệm 'hiệu quả có ý nghĩa lâm sàng' được đưa ra để bảo vệ chống lại xác suất trước 50% rằng 'phương pháp điều trị' sẽ được tìm thấy ' về mặt thống kê) hiệu quả tích cực đáng kể '(tuy nhiên rất nhỏ) trong một nghiên cứu lớn tùy ý.
Nếu tôi hiểu bản chất công việc của bạn, Clarinetist, thì vào cuối ngày, mục đích chính đáng của nó là thông báo các hành động / can thiệp để cải thiện giáo dục trong các trường học dưới tầm nhìn của bạn. Do đó, thiết lập của bạn là một lý thuyết quyết định và phương pháp Bayes là cách tiếp cận phù hợp nhất (và duy nhất mạch lạc [1] ).
Thật vậy, cách tốt nhất để hiểu các phương pháp thường xuyên là gần đúng với các phương pháp Bayes . Kích thước hiệu ứng ước tính có thể được hiểu là nhằm mục đích đo lường tính trung tâm cho phân bố sau của Bayes , trong khi giá trị p có thể được hiểu là nhằm mục đích đo một đuôi của hậu thế đó. Như vậy, cùng hai đại lượng này có chứa một số ý chính sơ bộ hậu Bayesian đó được hiểu là đầu vào tự nhiên để một cái nhìn quyết định lý thuyết về vấn đề của bạn. (Ngoài ra, khoảng tin cậy thường xuyên về kích thước hiệu ứng có thể được hiểu tương tự như khoảng tin cậy của Wannabe .)
Trong các lĩnh vực tâm lý học và giáo dục, phương pháp Bayes thực sự khá phổ biến. Một lý do cho điều này là rất dễ cài đặt 'cấu trúc' vào các mô hình Bayes, như các biến tiềm ẩn. Bạn có thể muốn xem 'cuốn sách cún con' của John K. Kruschke , một nhà tâm lý học. Trong giáo dục (nơi bạn có học sinh lồng nhau trong lớp học, lồng trong trường học, lồng trong quận, ...), mô hình phân cấp là không thể tránh khỏi. Và các mô hình Bayes cũng rất tốt cho mô hình phân cấp. Trên tài khoản này, bạn có thể muốn kiểm tra Gelman & Hill [2].
[1]: Robert, Christian P. Sự lựa chọn Bayes: Từ nền tảng quyết định-lý thuyết đến thực hiện tính toán. Tái bản lần 2 Các văn bản Springer trong Thống kê. New York: Springer, 2007.
[2]: Gelman, Andrew và Jennifer Hill. Phân tích dữ liệu bằng mô hình hồi quy và đa cấp / phân cấp. Phương pháp phân tích cho nghiên cứu xã hội. Cambridge; New York: Nhà xuất bản Đại học Cambridge, 2007.
Để biết thêm về 'sự gắn kết' từ quan điểm không nhất thiết phải đập bạn-trên-đầu-với-một-Bayesian , xem [3].
[3]: Robins, James và Larry Wasserman. Điều hòa nhiệt độ, khả năng thích ứng và sự gắn kết: Đánh giá một số khái niệm nền tảng. Tạp chí của Hiệp hội thống kê Hoa Kỳ 95, không. 452 (ngày 1 tháng 12 năm 2000): 1340 Từ46. doi: 10.1080 / 01621459.2000.10474344.
(*) Trong [4], Meehl quét NHST thanh lịch hơn nhiều, nhưng không kém phần mài mòn, như tôi làm:
Do giả thuyết không có giá trị luôn luôn sai, các bảng tóm tắt nghiên cứu về các mẫu của sự khác biệt đáng kể, nên ít nhiều phức tạp, kết quả không thể giải thích được của các hàm quyền lực thống kê.
[4]: Meehl, Paul. http://www3.nd.edu/~ghaeffel/Meehl(1978).pdf
Và đây là một trích dẫn có liên quan từ Tukey: /stats//a/728/41404