Kiểm định giả thuyết so với ước lượng tham số
Thông thường, các giả thuyết được đóng khung theo cách nhị phân. Tôi sẽ đặt các giả thuyết định hướng sang một bên, vì chúng không thay đổi vấn đề nhiều. Thông thường, ít nhất là trong tâm lý học, để nói về các giả thuyết như: sự khác biệt giữa các phương tiện nhóm là hoặc không bằng không; tương quan là hoặc không bằng không; hệ số hồi quy bằng hoặc không bằng 0; bình phương r là hoặc không bằng không. Trong tất cả các trường hợp này, có một giả thuyết không có tác dụng, và một giả thuyết khác về hiệu ứng.
Suy nghĩ nhị phân này thường không phải là điều chúng ta quan tâm nhất. Một khi bạn nghĩ về câu hỏi nghiên cứu của mình, bạn sẽ hầu như luôn thấy rằng bạn thực sự quan tâm đến việc ước tính các tham số. Bạn quan tâm đến sự khác biệt thực tế giữa các phương tiện nhóm, hoặc kích thước của mối tương quan, hoặc kích thước của hệ số hồi quy, hoặc lượng phương sai được giải thích.
Tất nhiên, khi chúng ta lấy một mẫu dữ liệu, ước tính mẫu của một tham số không giống với tham số dân số. Vì vậy, chúng ta cần một cách định lượng sự không chắc chắn của chúng ta về giá trị của tham số có thể là gì. Từ quan điểm thường xuyên, khoảng tin cậy cung cấp một phương tiện để làm, mặc dù những người theo chủ nghĩa thuần túy Bayes có thể lập luận rằng họ không cho phép nghiêm ngặt suy luận mà bạn có thể muốn thực hiện. Từ quan điểm của Bayes, các khoảng tin cậy về mật độ sau cung cấp một phương tiện trực tiếp hơn để định lượng sự không chắc chắn của bạn về giá trị của một tham số dân số.
Thông số / kích thước hiệu ứng
Di chuyển ra khỏi phương pháp kiểm tra giả thuyết nhị phân buộc bạn phải suy nghĩ một cách liên tục. Ví dụ, sự khác biệt kích thước trong nhóm có nghĩa là lý thuyết sẽ thú vị? Làm thế nào bạn có thể ánh xạ sự khác biệt giữa các nhóm có nghĩa là ngôn ngữ chủ quan hoặc ý nghĩa thực tế? Các biện pháp hiệu ứng được tiêu chuẩn hóa cùng với các tiêu chuẩn theo ngữ cảnh là một cách để xây dựng một ngôn ngữ để định lượng ý nghĩa của các giá trị tham số khác nhau. Các biện pháp như vậy thường được dán nhãn "kích thước hiệu ứng" (ví dụ: Cohen's d, r, , v.v.). Tuy nhiên, điều hoàn toàn hợp lý và thường được ưu tiên hơn là nói về tầm quan trọng của hiệu ứng bằng các biện pháp không đạt tiêu chuẩn (ví dụ, sự khác biệt trong nhóm có nghĩa là các biến số không đạt tiêu chuẩn có ý nghĩa như mức thu nhập, tuổi thọ, v.v.).R2
Có một tài liệu khổng lồ về tâm lý học (và các lĩnh vực khác) chỉ trích sự tập trung vào giá trị p, thử nghiệm ý nghĩa giả thuyết null, v.v. (xem tìm kiếm Google Scholar này ). Tài liệu này thường khuyến nghị kích thước hiệu ứng báo cáo với các khoảng tin cậy dưới dạng độ phân giải (ví dụ: Lực lượng đặc nhiệm APA của Wilkinson, 1999).
Các bước để di chuyển khỏi thử nghiệm giả thuyết nhị phân
Nếu bạn đang nghĩ về việc áp dụng suy nghĩ này, tôi nghĩ có những cách tiếp cận tinh vi hơn mà bạn có thể thực hiện:
- Cách tiếp cận 1a. Báo cáo ước tính điểm của hiệu ứng mẫu của bạn (ví dụ: sự khác biệt trung bình của nhóm) theo cả hai thuật ngữ thô và chuẩn. Khi bạn báo cáo kết quả của bạn thảo luận về cường độ như vậy có ý nghĩa gì đối với lý thuyết và thực hành.
- Cách tiếp cận 1b. Thêm vào 1a, ít nhất là ở mức rất cơ bản, một số ý nghĩa về sự không chắc chắn xung quanh ước tính tham số của bạn dựa trên kích thước mẫu của bạn.
- Cách tiếp cận 2. Cũng báo cáo khoảng tin cậy về kích thước hiệu ứng và kết hợp sự không chắc chắn này vào suy nghĩ của bạn về các giá trị hợp lý của tham số quan tâm.
- Cách tiếp cận 3. Báo cáo các khoảng tin cậy Bayes và kiểm tra ý nghĩa của các giả định khác nhau về khoảng tin cậy đó, chẳng hạn như lựa chọn trước, quy trình tạo dữ liệu được mô tả theo mô hình của bạn, v.v.
Trong số nhiều tài liệu tham khảo có thể, bạn sẽ thấy Andrew Gelman nói rất nhiều về những vấn đề này trên blog và trong nghiên cứu của mình.
Người giới thiệu
- Nickerson, RS (2000). Kiểm tra ý nghĩa giả thuyết Null: đánh giá về một cuộc tranh cãi cũ và tiếp tục. Phương pháp tâm lý, 5 (2), 241.
- Wilkinson, L. (1999). Phương pháp thống kê trong các tạp chí tâm lý học: hướng dẫn và giải thích. Nhà tâm lý học người Mỹ, 54 (8), 594. PDF