Giá trị p là 0,04993 có đủ để bác bỏ giả thuyết không?


20

Trong một thử nghiệm ý nghĩa thống kê có chữ ký của Wilcoxon, chúng tôi đã tìm thấy một số dữ liệu tạo ra giá trị là . Với ngưỡng , kết quả này có đủ để bác bỏ giả thuyết khống hay không, có an toàn hơn khi nói thử nghiệm không có kết luận, vì nếu chúng ta làm tròn giá trị p đến 3 vị trí thập phân thì nó trở thành ?p0,04993p<0,050,050


24
0,04993 <0,05, vì vậy nó chỉ thấp hơn. Bản năng của bạn là tốt khi không có giá trị P có thể được tin cậy đến một vài vị trí thập phân, nhưng nếu chương trình nói dưới 0,05, mọi người thường coi nó là giao hàng. Vấn đề thực sự ở đây là làm cho một thử nghiệm tầm quan trọng ở mức cố định sao cho <0,05 có nghĩa là "thực", "có thể xuất bản", "nguyên nhân cho hạnh phúc" và ngược lại có nghĩa là "ảo tưởng", "không thể xuất bản", "gây ra đau khổ" . Hầu hết các văn bản giới thiệu tốt về thống kê thảo luận về điều này ở một mức độ nào đó. Một trong những tốt là Freedman, Pisani, Purves, Statistics . New York: WW Norton, bất kỳ phiên bản nào.
Nick Cox

8
Bạn phải tự hỏi đâu sẽ là quyết định của bạn nếu giá trị p là 0,051? Nếu là 0,049 thì sao? Bạn sẽ đưa ra quyết định khác nhau? Tại sao?
AlefSin

2
Cảm ơn bạn đã bình luận của bạn. Trong trường hợp của chúng tôi, chúng tôi không cân nhắc liệu dữ liệu có thể được công bố hay không, v.v ... Chúng tôi chỉ đang xem xét đưa ra tuyên bố trong bài báo về ý nghĩa thống kê của kết quả này và chúng tôi muốn đảm bảo rằng tuyên bố của chúng tôi không chính xác hoặc không chính xác .
Hồi giáo El-Nabarawy

3
Báo cáo P = 0,04993 là những gì lò xo để tâm. Thật khó để dự đoán ý kiến ​​của người đánh giá hoặc người chỉnh sửa. Nếu bạn muốn làm tròn, chỉ định một quy ước làm tròn nhất quán luôn là một ý tưởng hay và được chấp nhận rộng rãi. Một số người sẽ làm tròn đến 3 dp và cũng có thể sử dụng một số loại quy ước có sao để báo cáo 0,050 (3 dp) và đánh dấu sao là <0,05 là phù hợp.
Nick Cox

2
Tôi không biết ... có lẽ chúng ta nên chạy bootstrap đôi và tính khoảng tin cậy cho giá trị ! Thành thật mà nói, tôi sẽ báo cáo: "Những phát hiện có ý nghĩa biên giới, 0,049 < p < 0,050 ." Vào thời điểm đó, bạn đang chia tóc và mọi người đột nhiên nhớ rằng 1/20 tỷ lệ dương tính giả là một cách hoàn toàn tùy tiện để điều hành khoa học. p0,049<p<0,050
AdamO

Câu trả lời:


21

Có hai vấn đề ở đây:

1) Nếu bạn đang làm một bài kiểm tra giả thuyết chính thức (và nếu bạn đi xa như trích dẫn một giá trị p trong cuốn sách của tôi thì bạn đã có), quy tắc từ chối chính thức là gì?

Khi so sánh thống kê kiểm tra với các giá trị tới hạn, giá trị tới hạn nằm trong vùng loại bỏ . Mặc dù hình thức này không quan trọng lắm khi mọi thứ đều liên tục, nhưng vấn đề là khi phân phối thống kê kiểm tra rời rạc.

Tương ứng, khi so sánh giá trị p và mức ý nghĩa, quy tắc là:

          Từ chối nếu pα

Xin lưu ý rằng, ngay cả khi bạn làm tròn giá trị p của mình lên 0,05, thực sự ngay cả khi giá trị p chính xác là 0,05, chính thức, bạn vẫn nên từ chối .

2) Xét về 'giá trị p của chúng tôi nói với chúng tôi là gì', thì giả sử bạn thậm chí có thể hiểu giá trị p là 'bằng chứng chống lại null' (giả sử rằng ý kiến ​​về điều đó có phần bị chia rẽ), 0,0499 và 0,0501 không thực sự nói những điều khác nhau về dữ liệu (kích thước hiệu ứng sẽ có xu hướng gần như giống hệt nhau).

α= =0,05


2
Nhưng, một lần nữa, bạn có thể sử dụng các đối số rất giống nhau để không từ chối null. Không có gì đặc biệt về 0,05, nếu bạn đã chọn 0,06 làm giới hạn của mình thì có lẽ bạn sẽ không đặt câu hỏi, nhưng tình huống sẽ không khác nhiều ... Thay vào đó, trong những tình huống này tôi sẽ hỏi: "thực tế là gì- ý nghĩa cuộc sống của kết quả này? ". Ví dụ, nếu đây là một thí nghiệm sinh học, tôi sẽ tìm kiếm ý nghĩa sinh học của kết quả cụ thể, báo cáo giá trị p như hiện tại và nhận xét về sinh học.
nico

@nico đây đã là điểm của mục của tôi (2); nó lập luận chống lại sự phụ thuộc quá mức vào cách tiếp cận chính thức trong (1)
Glen_b -Reinstate Monica

Cảm ơn bạn Glen và nico. Phần dữ liệu này là thứ yếu so với các thử nghiệm của chúng tôi, vì vậy chúng tôi mới kết thúc việc báo cáo giá trị như hiện tại. Trong mọi trường hợp, tôi đánh dấu đây là câu trả lời được chấp nhận. Cảm ơn một lần nữa cho tất cả những người tham gia với câu trả lời hoặc ý kiến.
Hồi giáo El-Nabarawy

5

Nó nằm trong mắt của kẻ si tình.

αα= =0,05

Vì vậy, nó thực sự sôi sục với những gì AlefSin đã nhận xét trước đó. Không thể có một "câu trả lời đúng" cho câu hỏi của bạn. Báo cáo những gì bạn có, làm tròn hoặc không.

Có một tài liệu rất lớn về "tầm quan trọng của ý nghĩa"; xem ví dụ bài báo gần đây của một trong những nhà thống kê hàng đầu của Đức Walter Krämer về "Sự sùng bái có ý nghĩa thống kê - Những gì các nhà kinh tế nên và không nên làm để nói chuyện dữ liệu của họ", Schmollers Jahrbuch 131 , 455-468, 2011.


-6

p= =0,05

Vấn đề chính là cụm từ này: "Chúng tôi đã xem qua một số dữ liệu ...".

pp

Có một tên cho loại trục trặc thống kê này: nạo vét dữ liệu . Tôi mơ hồ về việc báo cáo nó trong bài báo như một giả thuyết thú vị; nó có một số lý do vật lý mà bạn mong đợi nó giữ?

Tuy nhiên, có một lối thoát. Có lẽ bạn đã quyết định một tiên nghiệm để thực hiện chỉ một thử nghiệm này trên chỉ một bộ dữ liệu này. Bạn đã viết nó xuống sổ ghi chép trong phòng thí nghiệm của bạn, trước mặt ai đó để bạn có thể chứng minh điều đó sau. Sau đó, bạn đã làm bài kiểm tra của bạn.

p= =0,05


14
Điều này có thể là quá phụ thuộc vào một sự lựa chọn cụ thể của cụm từ; bạn đang giả định khá nhiều từ những gì có thể chỉ đơn giản là một sự lựa chọn từ ngữ kém - không phải ai ở đây cũng có tiếng Anh là ngôn ngữ đầu tiên. Nó chắc chắn đáng để nâng cao như một vấn đề tiềm năng, nhưng chỉ đơn giản là nói những điều rất hói ("hoàn toàn không") ngụ ý bạn biết nhiều hơn những gì chúng ta có thể nói từ những gì ở đây. (Hơn nữa, tham chiếu đến 'sổ ghi chép trong phòng thí nghiệm' ngụ ý OP đang làm việc trong phòng thí nghiệm. Tôi nghi ngờ đây là trường hợp. Một lần nữa, bạn ngụ ý rằng bạn biết nhiều hơn chúng ta có ở đây.)
Glen_b -Reinstate Monica

10
Mike McCoy, cảm ơn bạn đã trả lời, nhưng tôi sợ trong trường hợp này Glen_b là chính xác. Tôi không phải là người nói tiếng Anh bản địa, và trong khi tôi cố gắng viết và nói trôi chảy khi các kỹ năng của tôi cho phép, việc sử dụng và hàm ý tiếp tục trốn tránh tôi. Vì vậy, trong trường hợp cụ thể này, chúng tôi đã không thử những thứ khác nhau cho đến khi chúng tôi tìm thấy thứ gì đó có ý nghĩa. Trên thực tế, những gì chúng tôi đã cố gắng chứng minh là không có sự gia tăng đáng kể về mặt thống kê trong một số giá trị lỗi và trong một trường hợp cụ thể, chúng tôi thấy rằng lỗi thực sự đã giảm và khi chúng tôi chạy thử nghiệm W, đây là lúc chúng tôi nhận được 0,0499 .
Hồi giáo El-Nabarawy

1
Mike, tôi cũng không thấy có vấn đề gì trong việc đặt câu hỏi. Và dường như không ai khác nhìn thấy dấu hiệu của việc rình mò dữ liệu, khai thác, nạo vét, bất cứ điều gì ở đây ... Và nó chắc chắn nằm trong mắt của kẻ si tình. Không có thực tế toán học nhưng một quy tắc quyết định được lựa chọn bởi các nhà thống kê. Đọc lại những gì AlefSin, Glen trong quan điểm của anh ấy (2) và tôi đã viết.
Skullduggery

3
@ IslamEl-Nabarawy Nếu bạn muốn thiết lập sự tương đương / thiếu khác biệt, bạn có nhiều vấn đề khác ngoài cách diễn giải một giá trị gần với ngưỡng hoặc dữ liệu tiềm năng rình mò. Chỉ cần tìm giá trị p một chút so với 0,05 (hoặc bất kỳ mức lỗi nào bạn chọn) chắc chắn là không đủ. Tra cứu thử nghiệm cho sự tương đương, ở đây và các nơi khác hoặc đặt câu hỏi cụ thể về vấn đề đó bởi vì đó là một vấn đề hoàn toàn khác.
Gala

4
"Tuy nhiên, có một lối thoát. Có lẽ bạn đã quyết định một tiên nghiệm chỉ thực hiện một thử nghiệm này trên chỉ một bộ dữ liệu này. Bạn đã viết nó vào sổ ghi chép trong phòng thí nghiệm của bạn, trước một ai đó để bạn có thể chứng minh điều đó sau. bạn đã làm bài kiểm tra của mình. Nếu bạn đã làm điều này, thì kết quả của bạn có giá trị ở mức p = 0,05 và bạn có thể sao lưu nó cho những người hoài nghi như tôi. Nếu không, xin lỗi, đó không phải là kết quả có ý nghĩa thống kê "Hãy nói về tội lỗi cho đến khi được chứng minh vô tội. Vì vậy, trong trường hợp không có bằng chứng pháp y loại trừ sự không trung thực trong học tập, một phân tích là vô giá trị? Sheesh.
GoF_Logistic ngày
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.