Di chuột qua bất kỳ thẻ nào ( là thẻ giả) xuất hiện bên dưới để xem đoạn trích ngắn về wiki của nó. Xin vui lòng tha thứ cho sự gián đoạn của khoảng cách dòng. Tôi thấy nó đáng giá vì các trích đoạn thẻ có thể giúp người đọc kiểm tra sự hiểu biết về biệt ngữ trong khi đọc qua. Một số trích đoạn này cũng có thể xứng đáng được chỉnh sửa, vì vậy chúng cũng xứng đáng là một nhà báo, IMHO.←
p < 0,05 p > 0,05p>.05 thường ngụ ý người ta không nên từ chối giả thuyết khống . Ngược lại, lỗi loại i hoặc lỗi dương xảy ra khi người ta từ chối null do lỗi lấy mẫu hoặc một số sự cố bất thường khác tạo ra một mẫu không thể xảy ra (thường là với ) được lấy mẫu ngẫu nhiên từ dân số trong đó null là đúng. Một kết quả với được gọi là dương tính giả dường như phản ánh sự hiểu lầm về kiểm tra ý nghĩa giả thuyết nullp<.05p>.05ing (NHST). Những hiểu lầm không phải là hiếm trong các tài liệu nghiên cứu được công bố, vì NHST nổi tiếng là phản trực giác. Đây là một trong những tiếng kêu la của cuộc xâm lược Bayes (mà tôi ủng hộ, nhưng chưa làm theo ... chưa). Tôi đã làm việc với những ấn tượng sai lầm như những bản thân mình cho đến gần đây, vì vậy tôi thông cảm một cách chân thành nhất.
@DavidRobinson là đúng khi quan sát rằng không phải là xác suất của null là sai trong NHST thường xuyên . Đây là (ít nhất) một trong những quan niệm sai lầm "bẩn thỉu" của Goodman (2008) về giá trị (xem thêm Hurlbert & Lombardi, 2009 ) . Trong NHST, là xác suất mà người ta sẽ vẽ bất kỳ mẫu ngẫu nhiên nào trong tương lai bằng cùng một phương tiện sẽ thể hiện mối quan hệ hoặc sự khác biệt (hoặc bất kỳ kích thước hiệu ứng nàop p p ppp pđang được thử nghiệm với null, nếu các loại kích thước hiệu ứng khác tồn tại ...?) ít nhất khác với giả thuyết null như (các) mẫu từ cùng một quần thể người ta đã thử nghiệm để đạt đến một giá trị nhất định , nếu null là đúng. Nghĩa là, là xác suất lấy được một mẫu giống như của bạn với giá trị null ; nó không phản ánh xác suất của null - ít nhất, không trực tiếp. Ngược lại, các phương pháp Bayes tự hào về việc xây dựng các phân tích thống kê của họ, tập trung vào việc ước tính bằng chứng cho hoặc chống lại một lý thuyết trước đây về hiệu ứng được cung cấp dữ liệu , mà họ cho rằng là một cách tiếp cận trực quan hơn ( Wagenmakers, 2007pp) , trong số những lợi thế khác, và đặt ra những nhược điểm gây tranh cãi. (Công bằng mà nói, hãy xem " Nhược điểm của phân tích Bayes là gì? " Bạn cũng đã bình luận để trích dẫn các bài báo có thể đưa ra một số câu trả lời hay ở đó: Moyé, 2008; Hurlbert & Lombardi, 2009. )
Có thể cho rằng, giả thuyết null như đã nêu theo nghĩa đen thường có nhiều khả năng hơn là không sai, bởi vì các giả thuyết null là phổ biến nhất, theo nghĩa đen là các giả thuyết về hiệu ứng bằng không . (Đối với một số ví dụ phản biện hữu ích, hãy xem câu trả lời cho: " Các tập dữ liệu lớn có phù hợp để kiểm tra giả thuyết không? ") Các vấn đề triết học như hiệu ứng cánh bướm đe dọa tính hợp lệ của bất kỳ giả thuyết nào; do đó null là hữu ích nhất nói chung như là một cơ sở so sánh cho một giả thuyết thay thế của một số hiệu ứng khác không. Một giả thuyết thay thế như vậy có thể vẫn hợp lý hơn null sau khi dữ liệu được thu thập sẽ không thể thực hiện được nếu null là đúng. Do đó, các nhà nghiên cứu thường suy luận hỗ trợ cho một giả thuyết thay thế từ bằng chứng chống lại null, nhưng đó không phải là giá trị p định lượng trực tiếp ( Wagenmakers, 2007 ) .
Như bạn nghi ngờ, ý nghĩa thống kê là một chức năng của cỡ mẫu , cũng như kích thước hiệu ứng và tính nhất quán. (Xem @ câu trả lời gung của cho câu hỏi gần đây, " Làm thế nào có thể một t-test có ý nghĩa về mặt thống kê nếu chênh lệch trung bình là gần như 0? ") Những câu hỏi chúng ta thường có ý định hỏi về dữ liệu của chúng tôi là, "tác động của là gì x
trên y
? " Vì nhiều lý do (bao gồm IMO, các chương trình giáo dục bị hiểu sai và thiếu sót trong các số liệu thống kê, đặc biệt là được dạy bởi những người không thống kê), chúng tôi thường thấy mình thay vì hỏi theo nghĩa đen một cách lỏng lẻo, "Xác suất lấy mẫu dữ liệu như của tôi là ngẫu nhiên từ một dân số x
không ảnh hưởngy
? "Đây là sự khác biệt cơ bản giữa ước tính kích thước hiệu ứng và kiểm tra mức độ quan trọng. Một giá trị chỉ trả lời trực tiếp câu hỏi sau, nhưng một số chuyên gia (@rpierce có thể cung cấp cho bạn một danh sách tốt hơn tôi; tha thứ cho tôi vì đã kéo bạn vào đây !) đã lập luận rằng các nhà nghiên cứu đọc sai như một câu trả lời cho câu hỏi trước đây về kích thước hiệu ứng quá thường xuyên; tôi sợ tôi phải đồng ý.ppp
Để trả lời trực tiếp hơn về ý nghĩa của , đó là xác suất lấy mẫu dữ liệu ngẫu nhiên từ một quần thể có giá trị null là đúng, nhưng điều đó thể hiện mối quan hệ hoặc sự khác biệt khác với giá trị mà null mô tả theo nghĩa đen ít nhất là một biên độ rộng và nhất quán như dữ liệu của bạn ... <hít vào> ... nằm trong khoảng 5 59595%. Người ta chắc chắn có thể lập luận rằng đây là hậu quả của kích thước mẫu, bởi vì việc tăng kích thước mẫu sẽ cải thiện khả năng phát hiện kích thước hiệu ứng nhỏ và không nhất quán của một người và phân biệt chúng với hiệu ứng không có nghĩa là không có độ tin cậy vượt quá 5%. Tuy nhiên, kích thước hiệu ứng nhỏ và không nhất quán có thể có hoặc không có ý nghĩa thực tế ( có ý nghĩa thống kê≠.05<p<.95≠- một tá bẩn khác của Goodman (2008); điều này phụ thuộc nhiều vào ý nghĩa của dữ liệu, trong đó ý nghĩa thống kê chỉ liên quan đến chính nó ở một mức độ hạn chế. Xem câu trả lời của tôi cho ở trên .
Sẽ không đúng nếu gọi một kết quả chắc chắn là sai (thay vì chỉ đơn giản là không được hỗ trợ) nếu ... p> 0.95?
Kể từ khi dữ liệu nên thường đại diện cho những quan sát thực nghiệm thực tế, họ không phải là sai lầm; chỉ suy luận về họ nên đối mặt với rủi ro này, lý tưởng. (Tất nhiên, lỗi đo lường cũng xảy ra, nhưng vấn đề đó nằm ngoài phạm vi của câu trả lời này, vì vậy ngoài việc đề cập đến nó ở đây, tôi sẽ để nó một mình.) Một số rủi ro luôn tồn tại khi đưa ra suy luận tích cực sai về null là ít hữu ích so với giả thuyết thay thế, ít nhất là trừ khi người suy luận biết null là đúng. Chỉ trong hoàn cảnh khá khó hiểu về kiến thức mà null hoàn toàn đúng theo nghĩa đen thì một suy luận ủng hộ một giả thuyết thay thế chắc chắn là sai ... ít nhất là theo như tôi có thể tưởng tượng vào lúc này.
Rõ ràng, việc sử dụng rộng rãi hoặc quy ước không phải là cơ quan tốt nhất về hiệu lực epistemia hoặc suy luận. Ngay cả các tài nguyên được công bố là dễ đọc; xem ví dụ Fallacy trong định nghĩa giá trị p . Tài liệu tham khảo của bạn ( Hurlbert & Lombardi, 2009 ) cũng cung cấp một số giải thích thú vị về nguyên tắc này (trang 322):
StatSoft (2007) tự hào trên trang web của họ rằng hướng dẫn trực tuyến của họ là tài nguyên internet duy nhất về số liệu thống kê được đề xuất bởi Encyclopedia Brittanica. Chưa bao giờ nó lại quan trọng đến vậy với 'Cơ quan ủy thác', như nhãn dán bội nói. [URL bị hỏng được chuyển đổi thành văn bản siêu liên kết.]
Một trường hợp khác: cụm từ này trong một bài báo gần đây của Nature News ( Nuzzo, 2014 ) : "Giá trị P, một chỉ số chung cho sức mạnh của bằng chứng ..." Xem Wagenmakers ' (2007, trang 787) "Vấn đề 3: Các giá trị không định lượng bằng chứng thống kê "... Tuy nhiên, @MichaelLew ( Lew, 2013 ) không đồng ý theo cách bạn có thể thấy hữu ích: anh ta sử dụng giá trị để lập chỉ mục các hàm khả năng. Tuy nhiên, nhiều như những nguồn được công bố này mâu thuẫn với nhau, ít nhất một nguồn phải sai! (Ở một mức độ nào đó, tôi nghĩ ...) Tất nhiên, điều này không tệ như "không đáng tin" mỗi se.pppTôi hy vọng tôi có thể dỗ Michael vào đây bằng cách gắn thẻ anh ấy như tôi có (nhưng tôi không chắc chắn thẻ người dùng gửi thông báo khi được chỉnh sửa - Tôi không nghĩ bạn trong OP đã làm). Anh ta có thể là người duy nhất có thể cứu Nuzzo - ngay cả chính Thiên nhiên ! Giúp chúng tôi Obi-Wan! (Và tha thứ cho tôi nếu câu trả lời của tôi ở đây chứng tỏ rằng tôi vẫn không hiểu được ý nghĩa của công việc của bạn, mà tôi chắc chắn rằng tôi có trong mọi trường hợp ...) BTW, Nuzzo cũng đưa ra một số biện pháp tự vệ và từ chối hấp dẫn "Vấn đề 3" của Wagenmaakers: xem hình "Nguyên nhân có thể" của Nuzzo và các trích dẫn hỗ trợ ( Goodman, 2001 , 1992; Gorroochurn, Hodge, Heiman, Durner, & Greenberg, 2007 ) . Đây chỉ có thể chứa câu trả lời bạn '
Re: câu hỏi trắc nghiệm của bạn, tôi chọn d
. Bạn có thể đã hiểu sai một số khái niệm ở đây, nhưng bạn chắc chắn không cô đơn nếu vậy, và tôi sẽ để lại sự phán xét cho bạn, vì chỉ có bạn biết những gì bạn thực sự tin. Giải thích sai ngụ ý một số lượng chắc chắn, trong khi đặt câu hỏi ngụ ý ngược lại, và sự thúc đẩy để đặt câu hỏi khi không chắc chắn là khá đáng khen ngợi và không phổ biến ở khắp mọi nơi. Vấn đề bản chất con người này làm cho tính không chính xác của các công ước của chúng ta đáng buồn là vô hại, và đáng bị khiếu nại như những điều được đề cập ở đây. (Cảm ơn một phần cho bạn!) Tuy nhiên, đề xuất của bạn cũng không hoàn toàn chính xác.
Một số thảo luận thú vị về các vấn đề liên quan đến giá trị mà tôi đã tham gia xuất hiện trong câu hỏi này: Điều chỉnh các quan điểm cố thủ của các giá trị p . Câu trả lời của tôi liệt kê một vài tài liệu tham khảo mà bạn có thể thấy hữu ích để đọc thêm về các vấn đề diễn giải và giải pháp thay thế cho giá trị . Được cảnh báo trước: Tôi vẫn chưa tự mình chạm đáy hố thỏ đặc biệt này , nhưng ít nhất tôi có thể nói với bạn rằng nó rất sâu . Tôi vẫn đang tự tìm hiểu về nó (tôi nghi ngờ tôi sẽ viết từ góc nhìn Bayes hơn [sửa]: hoặc có thể là viễn cảnh NFSA! Hurlbert & Lombardi, 2009 )ppp, Tôi là người có thẩm quyền yếu nhất, và tôi hoan nghênh mọi sửa đổi hoặc công phu mà người khác có thể đưa ra cho những gì tôi đã nói ở đây. Tất cả những gì tôi có thể nói trong kết luận là có lẽ có một câu trả lời đúng về mặt toán học, và có lẽ hầu hết mọi người đều hiểu sai. Câu trả lời đúng chắc chắn không đến dễ dàng, vì các tài liệu tham khảo sau đây chứng minh ...
PS Như được yêu cầu (loại ... Tôi thừa nhận tôi thực sự chỉ giải quyết vấn đề này thay vì làm việc với nó), câu hỏi này là một tài liệu tham khảo tốt hơn cho phân phối đôi khi của được đưa ra null: " Tại sao giá trị p thống nhất phân phối theo giả thuyết khống ? "Quan tâm đặc biệt là những bình luận của @ whuber, đưa ra một lớp ngoại lệ. Như một phần nào đó đúng với toàn bộ cuộc thảo luận, tôi không tuân theo các lập luận 100%, chứ đừng nói đến ý nghĩa của chúng, vì vậy tôi không chắc những vấn đề với tính đồng nhất phân phối thực sự là đặc biệt. Nguyên nhân nữa cho sự nhầm lẫn thống kê sâu rộng, tôi sợ ...ppp
Người giới thiệu
- Người tốt, SN (1992). Một nhận xét về sao chép, P ‐values và bằng chứng. Thống kê trong Y học, 11 (7), 875 trừ879.
- Người tốt, SN (2001). Of P -values và Bayes: Một đề xuất khiêm tốn. Dịch tễ học, 12 (3), 295 bóng297. Lấy từ http://swfsc.noaa.gov/uploadedFiles/Divutions/PRD/Programs/ETP_Cetacean_Assessment/Of_P_Values_and_Bayes__A_Modest_Proposal.6.pdf .
- Người tốt, S. (2008). Một tá bẩn: Mười hai quan niệm sai lầm P -value. Hội thảo chuyên ngành huyết học, 45 (3), 135 chuyến140. Lấy từ http://xa.yimg.com/kq/groups/18751725/636586767/name/twelve+P+value+misconceptions.pdf .
- Gorroochurn, P., Hodge, SE, Heiman, GA, Durner, M., & Greenberg, DA (2007). Không sao chép các nghiên cứu về hiệp hội: Thất bại giả giả có thể sao chép? Di truyền học trong y học, 9 (6), 325 bóng31. Lấy từ http://www.nature.com/gim/journal/v9/n6/full/gim200755a.html .
- Hurlbert, SH, & Lombardi, CM (2009). Sự sụp đổ cuối cùng của khung lý thuyết quyết định của Neyman hạng Pearson và sự trỗi dậy của tân sinh viên. Annales Zoologici Fennici, 46 (5), 311 Từ349. Lấy từ http://xa.yimg.com/kq/groups/1542294/508917937/name/HurlbertLombardi2009AZF.pdf .
- Luân, MJ (2013). To P or not to P: Về bản chất chứng minh của các giá trị P và vị trí của chúng trong suy luận khoa học. arXiv: 1311.0081 [stat.ME]. Lấy ra từhttp://arxiv.org/abs/1311.0081 .
- Moyé, LA (2008). Bayes trong các thử nghiệm lâm sàng: Ngủ tại công tắc. Thống kê trong Y học, 27 (4), 469 Bóng482.
- Nuzzo, R. (2014, ngày 12 tháng 2). Phương pháp khoa học: Lỗi thống kê. Tin tức thiên nhiên, 506 (7487). Lấy từ http://www.nature.com/news/scientific-method-statistic-errors-1.14700 .
- Wagenmakers, EJ (2007). Một giải pháp thực tế cho các vấn đề phổ biến của các giá trị p . Bản tin & Đánh giá tâm lý, 14 (5), 779 Từ804. Lấy từ http://www.brainlife.org/reprint/2007/Wagenmakers_EJ071000.pdf .