Tài liệu tham khảo có chứa các đối số chống lại thử nghiệm ý nghĩa giả thuyết null?


63

Trong vài năm qua, tôi đã đọc một số bài báo lập luận chống lại việc sử dụng thử nghiệm ý nghĩa giả thuyết null trong khoa học, nhưng không nghĩ sẽ giữ một danh sách liên tục. Một đồng nghiệp gần đây đã yêu cầu tôi cho một danh sách như vậy, vì vậy tôi nghĩ tôi đã yêu cầu mọi người ở đây giúp xây dựng nó. Để bắt đầu mọi thứ, đây là những gì tôi có cho đến nay:


4
Nó không liên quan 100%, vì vậy tôi không đăng bài này dưới dạng câu trả lời. Nhưng, JPA Ioannidis, Tại sao hầu hết các kết quả nghiên cứu được công bố là sai , PLoS Med 2 (8): e124, 2005. đáng để đọc.
hồng y

1
Một cuốn sách nổi tiếng trong số các nhà kinh tế là Ziliak, Stephen T. và Deirdre Nansen Mccloskey. Sự sùng bái có ý nghĩa thống kê: Làm thế nào lỗi tiêu chuẩn khiến chúng ta mất việc, công bằng và cuộc sống. Nhà xuất bản Đại học Michigan, 2008
Waldemar

1
Mục tiêu ở đây là gì?
Aksakal 4/2/2015

Vào tháng 3 năm 2016, ASA đã ban hành một "Tuyên bố về giá trị p" chính thức .
Kenny LJ

1
Rất nhiều tài liệu tham khảo được liệt kê trên trang này (bao gồm cả ý kiến): lesswrong.com/lw/g13/against_nhst . Thêm tài liệu tham khảo trong câu trả lời của Glen_b tại đây: stats.stackexchange.com/questions/142533 .
amip nói rằng Phục hồi Monica

Câu trả lời:


42

Chris Fraley đã dạy cả một khóa học về lịch sử của cuộc tranh luận (liên kết dường như bị phá vỡ, mặc dù nó vẫn còn trên trang web chính thức của anh ta, đây là một bản sao trong Lưu trữ Internet ). Tóm tắt / kết luận của ông là ở đây (một lần nữa, bản sao lưu trữ ). Theo trang chủ của Fraley, lần cuối cùng anh dạy khóa học này là vào năm 2003.

Anh ấy mở đầu danh sách này bằng một "thiên vị của giảng viên":

Mặc dù mục tiêu của tôi là tạo điều kiện cho các cuộc thảo luận sôi nổi, sâu sắc và công bằng về các vấn đề hiện tại, tôi tin rằng cần phải làm rõ sự thiên vị của tôi ngay từ đầu. Paul Meehl đã từng tuyên bố rằng "Ngài Ronald [Fisher] đã làm chúng tôi hoang mang, mê hoặc chúng tôi và dẫn chúng tôi xuống con đường hoa anh thảo. Tôi tin rằng sự phụ thuộc gần như phổ quát vào việc chỉ bác bỏ giả thuyết khống là phương pháp tiêu chuẩn để chứng thực các lý thuyết thực tế các lĩnh vực là một sai lầm khủng khiếp, về cơ bản là không có căn cứ, chiến lược khoa học kém và là một trong những điều tồi tệ nhất từng xảy ra trong lịch sử tâm lý học. " Tôi lặp lại tình cảm của Meehl. Một trong những mục tiêu của tôi trong hội thảo này là làm rõ lý do tại sao tôi tin rằng đây là trường hợp. Hơn nữa, tôi mong bạn, đến khi bạn hoàn thành hội thảo này,

Tôi sẽ sao chép trong danh sách đọc trong trường hợp trang khóa học biến mất:

Tuần 1. Giới thiệu: Thử nghiệm Ý nghĩa Giả thuyết Null là gì? Sự thật, huyền thoại và tình trạng khoa học của chúng ta

  • Lyken, DL (1991). Tâm lý có gì sai? Trong D. Cicchetti & WM Grove (chủ biên), Suy nghĩ rõ ràng về Tâm lý học, tập. 1: Những vấn đề về lợi ích công cộng, Những bài tiểu luận vinh danh Paul E. Meehl (trang 3 - 39). Minneapolis, MN: Nhà in Đại học Minnesota.

Tuần 2. Những chỉ trích sớm về NHST

  • Meehl, PE (1967). Kiểm định lý thuyết trong tâm lý học và vật lý: Một nghịch lý phương pháp luận. Triết học về khoa học, 34, 103-115.

  • Meehl, PE (1978). Rủi ro lý thuyết và dấu hoa thị dạng bảng: Ngài Karl, Ngài Ronald và sự tiến triển chậm của tâm lý mềm. Tạp chí tư vấn và tâm lý học lâm sàng, 46, 806-834.

  • Rozeboom, WW (1960). Sai lầm của thử nghiệm ý nghĩa giả thuyết null. Bản tin tâm lý, 57, 416-428.

  • Bakan, D. (1966). Các thử nghiệm có ý nghĩa trong nghiên cứu tâm lý. Bản tin tâm lý, 66, 423-437. [không bắt buộc]

Tuần 3. Những phê bình đương đại về NHST

  • Cohen, J. (1994). Trái đất tròn (p <0,05). Nhà tâm lý học người Mỹ, 49, 997-1003.

  • Gigerenzer, G. (1993). Superego, cái tôi và id trong lý luận thống kê. Trong G. Keren & C. Lewis (Eds.), Cẩm nang phân tích dữ liệu trong khoa học hành vi: Các vấn đề phương pháp luận (tr. 311-339). Hillsdale, NJ: Cộng sự Lawrence Erlbaum.

  • Schmidt, FL & Hunter, JE (1997). Tám phản đối phổ biến nhưng sai đối với việc ngừng thử nghiệm ý nghĩa trong phân tích dữ liệu nghiên cứu. Trong Lisa A. Harlow, Stanley A. Mulaik và James H. Steiger (Eds.) Nếu không có xét nghiệm quan trọng thì sao? (trang 37-64). Mahwah, NJ: Cộng sự Lawrence Erlbaum.

  • Oakes, M. (1986). Suy luận thống kê: Một bình luận cho các khoa học xã hội và hành vi. New York: Wiley. (Chương 2 [Một bài phê bình về các bài kiểm tra quan trọng]) [tùy chọn]

Tuần 4. Từ chối: Những người ủng hộ NHST hãy đến với Quốc phòng của nó

  • Frick, RW (1996). Việc sử dụng thích hợp của thử nghiệm giả thuyết null. Phương pháp tâm lý, 1, 379-390.

  • Hagen, RL (1997). Để ca ngợi các thử nghiệm thống kê giả thuyết null. Nhà tâm lý học người Mỹ, 52, 15-24.

  • Wilkinson, L., và Lực lượng đặc nhiệm về suy luận thống kê. (1999). Phương pháp thống kê trong các tạp chí tâm lý học: Hướng dẫn và giải thích. Nhà tâm lý học người Mỹ, 54, 594-604.

  • Wainer, H. (1999). Một người cổ vũ cho thử nghiệm ý nghĩa giả thuyết null. Phương pháp tâm lý, 6, 212-213.

  • Mulaik, SA, Raju, NS, & Harshman, RA (1997). Có một thời gian và địa điểm để thử nghiệm có ý nghĩa. Trong Lisa A. Harlow, Stanley A. Mulaik và James H. Steiger, Eds. Nếu không có xét nghiệm quan trọng thì sao? (trang 65-116). Mahwah, NJ: Cộng sự Lawrence Erlbaum. [không bắt buộc]

Tuần 5. Từ chối: Những người ủng hộ NHST hãy đến với Quốc phòng của nó

  • Abelson, RP (1997). Về tuổi thọ đáng ngạc nhiên của những con ngựa bị mắc kẹt: Tại sao có một trường hợp cho bài kiểm tra quan trọng. Khoa học tâm lý, 8, 12-15.

  • Krueger, J. (2001). Thử nghiệm ý nghĩa giả thuyết Null: Về sự tồn tại của một phương pháp thiếu sót. Nhà tâm lý học người Mỹ, 56, 16-26.

  • Scarr, S. (1997). Quy tắc bằng chứng: Một bối cảnh lớn hơn cho các cuộc tranh luận thống kê. Khoa học tâm lý, 8, 16-17.

  • Greenwald, AG, Gonzalez, R., Harris, RJ, & Guthrie, D. (1996). Kích thước hiệu ứng và giá trị p: Điều gì cần được báo cáo và điều gì cần được nhân rộng? Tâm sinh lý, 33, 175-183.

  • Nickerson, RS (2000). Kiểm tra ý nghĩa giả thuyết Null: Một đánh giá về một cuộc tranh cãi cũ và tiếp tục. Phương pháp tâm lý, 5, 241-301. [không bắt buộc]

  • Harris, RJ (1997). Các bài kiểm tra quan trọng có vị trí của họ. Khoa học tâm lý, 8, 8-11. [không bắt buộc]

Tuần 6. Kích thước hiệu ứng

  • Rosenthal, R. (1984). Thủ tục siêu phân tích cho nghiên cứu xã hội. Hillsly Hills, CA: Hiền nhân. [Ch. 2, Xác định kết quả nghiên cứu]

  • Châu Tinh Trì, SL (1988). Kiểm tra ý nghĩa hay kích thước hiệu ứng? Bản tin tâm lý, 103, 105-110.

  • Abelson, RP (1985). Một nghịch lý giải thích phương sai: Khi một chút là rất nhiều. Bản tin tâm lý, 97, 129-133. [không bắt buộc]

Tuần 7. Sức mạnh thống kê

  • Hallahan, M., & Rosenthal, R. (1996). Sức mạnh thống kê: Khái niệm, thủ tục và ứng dụng. Nghiên cứu hành vi và trị liệu, 34, 489-499.

  • Sedlmeier, P., & Gigerenzer, G. (1989). Các nghiên cứu về sức mạnh thống kê có ảnh hưởng đến sức mạnh của các nghiên cứu? Bản tin tâm lý, 105, 309-316.

  • Cohen, J. (1962). Sức mạnh thống kê của nghiên cứu tâm lý xã hội bất thường: Một đánh giá. Tạp chí Tâm lý học bất thường và xã hội, 65, 145-153. [không bắt buộc]

  • Maddock, JE, Rossi, JS (2001). Sức mạnh thống kê của các bài báo được công bố trong ba tạp chí liên quan đến sức khỏe tâm lý. Tâm lý học sức khỏe, 20, 76-78. [không bắt buộc]

  • Thomas, L. & Juanes, F. (1996). Tầm quan trọng của phân tích sức mạnh thống kê: Một ví dụ từ Hành vi động vật. Hành vi động vật, 52, 856-859. [không bắt buộc]

  • Rossi, JS (1990). Sức mạnh thống kê của nghiên cứu tâm lý: Chúng ta đã đạt được gì sau 20 năm? Tạp chí tư vấn và tâm lý học lâm sàng, 58, 646-656. [không bắt buộc]

  • Tukey, JW (1969). Phân tích dữ liệu: Công tác trừng phạt hay thám tử? Nhà tâm lý học người Mỹ, 24, 83-91. [không bắt buộc]

Tuần 8. Kiểm tra khoảng tin cậy và Ý nghĩa

  • Người làm vườn, MJ, & DG Altman. 1986. Khoảng tin cậy thay vì giá trị P: Ước tính thay vì kiểm tra giả thuyết. Tạp chí Y học Anh, số 292, 746-750.

  • Cumming, G., & Finch, S. (2001). Sơ lược về sự hiểu biết, sử dụng và tính toán các khoảng tin cậy dựa trên các phân phối trung tâm và phi tập trung. Đo lường giáo dục và tâm lý, 61, 532-574.

  • Gác xép, GR, & Masson, MEJ (1994). Sử dụng khoảng tin cậy trong các thiết kế bên trong chủ đề. Bản tin và đánh giá tâm lý, 1, 476-490.

Tuần 9 [lưu ý: chúng tôi đang bỏ qua phần này]. Mô hình lý thuyết: Phát triển các mô hình chính thức của hiện tượng tự nhiên

  • Haefner, JW (1996). Mô hình hóa các hệ thống sinh học: Nguyên tắc và ứng dụng. New York: Nhà xuất bản Thomson quốc tế. (Chương 1 [Mô hình hệ thống] & 2 [Quá trình mô hình hóa])

  • Loehlin, JC (1992). Các mô hình biến tiềm ẩn: Giới thiệu về yếu tố, đường dẫn và phân tích cấu trúc. Hillsdale, NJ: Cộng sự Lawrence Erlbaum. (Chương 1 [Các mô hình đường dẫn trong phân tích nhân tố, đường dẫn và cấu trúc], trang 1-18]

  • Cấp, DA (1962). Kiểm tra giả thuyết khống và chiến lược nghiên cứu các mô hình lý thuyết. Đánh giá tâm lý, 69, 54-61. [không bắt buộc]

  • Chất kết dính, A. (1963). Xem xét thêm về việc kiểm tra giả thuyết null và chiến lược và chiến thuật điều tra các mô hình lý thuyết. Đánh giá tâm lý, 70, 107-115. [không bắt buộc]

  • Edwards, W. (1965). Chiến thuật lưu ý về mối quan hệ giữa các giả thuyết khoa học và thống kê. Bản tin tâm lý, 63, 400-402. [không bắt buộc]

Tuần 10. Ý nghĩa của xác suất là gì? Tranh cãi liên quan đến tần suất tương đối và xác suất chủ quan

  • Salsburg, D. (2001). Người phụ nữ nếm trà: Cách thống kê cách mạng khoa học trong thế kỷ XX. New York: WH Freeman. (Chương 10, 11, & 12)

  • Oakes, M. (1986). Suy luận thống kê: Một bình luận cho các khoa học xã hội và hành vi. New York: Wiley. (Chương 4, 5, & 6)

  • Pruzek, RM (1997). Giới thiệu về suy luận Bayes và các ứng dụng của nó. Trong Lisa A. Harlow, Stanley A. Mulaik và James H. Steiger, Eds. Nếu không có xét nghiệm quan trọng thì sao? (trang 287-318). Mahwah, NJ: Cộng sự Lawrence Erlbaum.

  • Rindskoph, DM (1997). Thử nghiệm "nhỏ", không null, giả thuyết: Phương pháp cổ điển và Bayes. Trong Lisa A. Harlow, Stanley A. Mulaik và James H. Steiger (Eds). Nếu không có xét nghiệm quan trọng thì sao? (trang 319-32). Mahwah, NJ: Cộng sự Lawrence Erlbaum.

  • Edwards, W., Lindman, H., Savage, LJ (1963). Bayesian suy luận thống kê cho nghiên cứu tâm lý. Đánh giá tâm lý, 70, 193-242. [không bắt buộc]

Tuần 11. Thẩm định lý thuyết: Triết học về khoa học và kiểm tra và sửa đổi lý thuyết

  • Meehl, PE (1990). Thẩm định và sửa đổi các lý thuyết: Chiến lược phòng thủ của Lakatos và hai nguyên tắc bảo đảm nó. Điều tra tâm lý, 1, 108-141.

  • Roberts, S. & Pashler, H. (2000). Làm thế nào thuyết phục là một phù hợp tốt? Một nhận xét về kiểm tra lý thuyết. Đánh giá tâm lý, 107, 358-367.

Tuần 12. Đánh giá lý thuyết: Triết lý của khoa học và kiểm tra và sửa đổi lý thuyết

  • Urbach, P. (1974). Tiến bộ và thoái hóa trong "cuộc tranh luận IQ" (I). Tạp chí Triết học Khoa học Anh, 25, 99-125.

  • Serlin, RC & Lapsley, DK (1985). Tính hợp lý trong nghiên cứu tâm lý: Nguyên tắc đủ tốt. Nhà tâm lý học người Mỹ, 40, 73-83.

  • Dar, R. (1987). Một cái nhìn khác về Meehl, Lakatos và thực tiễn khoa học của các nhà tâm lý học. Nhà tâm lý học người Mỹ, 42, 145-151.

  • Gholson, B. & Barker, P. (1985). Kuhn, Lakatos, & Laudan: Các ứng dụng trong lịch sử vật lý và tâm lý học. Nhà tâm lý học người Mỹ, 40, 755-769. [không bắt buộc]

  • Faust, D., & Meehl, PE (1992). Sử dụng phương pháp khoa học để giải quyết các câu hỏi trong lịch sử và triết học của khoa học: Một số minh họa. Trị liệu hành vi, 23, 195-211. [không bắt buộc]

  • Urbach, P. (1974). Tiến bộ và thoái hóa trong "cuộc tranh luận IQ" (II). Tạp chí Triết học Khoa học Anh, 25, 235-259. [không bắt buộc]

  • Cá hồi, WC (1973, tháng 5). Xác nhận. Khoa học Mỹ, 228, 75-83. [không bắt buộc]

  • Meehl, PE (1993). Triết lý của khoa học: Giúp đỡ hay cản trở? Báo cáo tâm lý, 72, 707-733. [tùy chọn] Manicas. PT, & Secord, PF (1983). Ý nghĩa đối với tâm lý học của triết học mới của khoa học. Nhà tâm lý học người Mỹ, 38, 399-413. [không bắt buộc]

Tuần 13. Truyền thống NHST đã phá hoại một nền tảng kiến ​​thức tích lũy, không thiên vị trong tâm lý học?

  • Cooper, H., DeNeve, K., & Charlton, K. (1997). Tìm kiếm khoa học bị mất tích: Số phận của các nghiên cứu được đệ trình để xem xét bởi một ủy ban đối tượng của con người. Phương pháp tâm lý, 2, 447-452.

  • Schmidt, FL (1996). Kiểm tra ý nghĩa thống kê và kiến ​​thức tích lũy trong tâm lý học: Ý nghĩa cho việc đào tạo các nhà nghiên cứu. Phương pháp tâm lý, 1, 115-129.

  • Greenwald, AG (1975). Hậu quả của định kiến ​​chống lại giả thuyết khống. Bản tin tâm lý, 82, 1-20.

  • Berger, JO & Berry, DA (1988). Phân tích thống kê và ảo tưởng về tính khách quan. Nhà khoa học Mỹ, 76, 159-165.

Tuần 14. Nhân rộng và liêm chính khoa học

  • Smith, NC (1970). Nghiên cứu nhân rộng: Một khía cạnh bị bỏ quên của nghiên cứu tâm lý. Nhà tâm lý học người Mỹ, 25, 970-975.

  • Sohn, D. (1998). Ý nghĩa thống kê và khả năng nhân rộng: Tại sao cái trước không báo trước cái sau. Lý thuyết và Tâm lý học, 8, 291-311.

  • Meehl, PE (1990). Tại sao tóm tắt nghiên cứu về lý thuyết tâm lý thường không thể giải thích được. Báo cáo tâm lý, 66, 195-244.

  • Platt, JR (1964). Suy luận mạnh mẽ. Khoa học, 146, 347-353.

  • Feynman, RL (1997). Chắc chắn là bạn đang đùa, ông Feynman! New York: WW Norton. (Chương: Khoa học vận chuyển hàng hóa).

  • Người ghi bàn, LG (1991). Một số huyền thoại của khoa học trong tâm lý học. Trong D. Cicchetti & WM Grove (chủ biên), Suy nghĩ rõ ràng về Tâm lý học, tập. 1: Những vấn đề về lợi ích công cộng, Những bài tiểu luận vinh danh Paul E. Meehl (trang 61 - 87). Minneapolis, MN: Nhà in Đại học Minnesota. [không bắt buộc]

  • Lindsay, RM & Ehrenberg, ASC (1993). Việc thiết kế các nghiên cứu nhân rộng. Nhà thống kê người Mỹ, 47, 217-228. [không bắt buộc]

Tuần 15. Suy nghĩ định lượng: Tại sao chúng ta cần Toán học (chứ không phải NHST mỗi lần) trong Khoa học Tâm lý

  • Aiken, LS, Tây, SG, Sechrest, L., & Reno, RR (1990). Đào tạo sau đại học về thống kê, phương pháp và đo lường trong tâm lý học: Một cuộc khảo sát của Ph.D. các chương trình tại Bắc Mỹ. Nhà tâm lý học người Mỹ, 45, 721-734.

  • Meehl, PE (1998, tháng 5). Sức mạnh của tư duy định lượng. Địa chỉ được mời với tư cách là người nhận giải thưởng James McKeen Cattell tại cuộc họp thường niên của Hiệp hội Tâm lý học Hoa Kỳ, Washington, DC.


5
+1. Thật thú vị - và khá là nói - rằng các bài đọc bắt đầu và kết thúc với Meehl.
whuber

2
Bạn đã thực hiện một dịch vụ thực sự trong việc chia sẻ điều này.
rolando2

2
Các liên kết đến khóa học và tóm tắt dường như bị phá vỡ. Bạn có thể tìm thấy thông tin thông qua dự án Lưu trữ: web.archive.org/web/20151023151618/http://www.uic.edu/groupes/ọ
AG


Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.