Là p = 5,0% có ý nghĩa?


14

Hôm nay tôi được hỏi, liệu giá trị p 0,05 (chính xác) có được coi là đáng kể (cho alpha = 5%) hay không. Tôi không biết câu trả lời và Google đã đưa ra cả hai câu trả lời: (a) kết quả rất có ý nghĩa nếu p nhỏ hơn 5% và (b) nếu p nhỏ hơn 5% hoặc bằng 5%.

Tất nhiên, không ai trong số các trang web này trích dẫn bất cứ ai. Tại sao một người nên - đó là kiến ​​thức phổ biến và 5% là tùy ý. Nhưng điều đó sẽ không giúp tôi nói với học sinh của mình một vài điều cần nhớ.

Vì vậy, đây là những câu hỏi tuyệt vọng của tôi về các giả thuyết thử nghiệm: Nếu giá trị p chính xác là alpha - tôi có xem xét kết quả có ý nghĩa hay không? Và trích dẫn có thẩm quyền trong trường hợp này là gì?

Cảm ơn rât nhiều

Câu trả lời:


19

Bỏ qua một số vấn đề thực tế (chẳng hạn như mức độ mà là tùy ý), các định nghĩa về mức ý nghĩa và giá trị p làm cho câu trả lời cho câu hỏi này không rõ ràng.α

Nghĩa là, chính thức, quy tắc từ chối là bạn từ chối khi .p=α

Nó thực sự chỉ quan trọng đối với trường hợp riêng biệt, nhưng trong tình huống đó, nếu bạn không từ chối khi , tỷ lệ lỗi loại I của bạn sẽ không thực sự là α !p=αα

(Theo như tôi lo ngại thì không có trích dẫn 'có thẩm quyền'; bạn thực sự cần phải nắm bắt cả hai cách tiếp cận Neyman-Pearson và Ngư dân để kiểm tra giả thuyết, và đó là thứ phát triển theo thời gian.)

Có bất kỳ số lượng các văn bản thống kê tốt mô tả chính xác kiểm tra giả thuyết.

Định nghĩa của giá trị p được đưa ra chính xác trong câu đầu tiên của bài viết Wikipedia có liên quan *:

giá trị p là xác suất để có được một thống kê kiểm tra ít nhất là cực trị như giá trị thực tế đã được quan sát, giả sử rằng giả thuyết null là đúng.

* (và không, wikipedia không phải là cơ quan có thẩm quyền, tôi chỉ nói rằng định nghĩa này là đúng)

Để đơn giản, chúng ta hãy gắn bó với null null; nó phục vụ để có được điểm qua mà không làm vấy bẩn vùng biển với các vấn đề bổ sung.

Bây giờ mức ý nghĩa, là tỷ lệ lỗi loại I đã chọn. Đây là tỷ lệ mà bạn chọn giả thuyết khống sẽ bị từ chối khi nó đúng. Đó là, đó là tỷ lệ thời gian bạn nên từ chối null. Bây giờ hãy xem xét một số liệu thống kê thử nghiệm với một phân phối rời rạc - lần duy nhất một p của chính xác α là thực sự tốt **. (Thông thường cũng sẽ là trường hợp alpha thực tế sẽ khác với thứ gì đó đẹp và tròn như 5%.)αp α

** Chà tôi đoán rằng tôi đang giới hạn cuộc thảo luận của mình để chỉ thống kê thử nghiệm phân tán hoàn toàn rời rạc hoặc hoàn toàn liên tục. Trong trường hợp hỗn hợp, bạn có thể tìm ra cách áp dụng thảo luận rời rạc của tôi (trong các tình huống khi áp dụng).

n=17α=4.904%137500217

H0p=αα

H0p=αα

p=α

p=α

Nếu bạn mô tả quy tắc từ chối của bạn lên phía trước và cho thấy rằng (nếu các giả định được thỏa mãn), nó có mức ý nghĩa mong muốn, thì có lẽ không cần tham khảo.

H0

α

(Nếu bạn có một phiên bản khác, số trang có thể thay đổi, nhưng nó có một chỉ mục, vì vậy bạn có thể tra cứu các điều khoản; hãy cẩn thận, bạn có thể cần xem các danh sách trong 'Kiểm tra giả thuyết' hoặc một cái gì đó tương tự trong chỉ mục để tìm 'vùng từ chối')

Hmm, chúng ta hãy thử một cuốn sách khác ra khỏi kệ. Thống kê toán học của Wackerly, Mendenhall & Scheaffer với các ứng dụng, ấn bản thứ 5 , xác định vùng loại bỏ trên p412 và giá trị p (giống như def của C & B) trên p431.


Cảm ơn bạn. Vui lòng cho tôi câu hỏi ngu ngốc của một "người sử dụng thống kê thực tế": Trường hợp ngoại trừ Wikipedia tôi sẽ tìm thấy định nghĩa và / hoặc quy tắc từ chối này, bạn đề cập đến? Tôi đã sàng lọc một số sách thống kê, nhưng không tìm thấy đoạn văn. Có lẽ đang tìm kiếm những từ sai ...
BurninLeo 16/12/13

xem cập nhật để trả lời
Glen_b -Reinstate Monica

Bạn tuyệt vời! Chắc chắn, bạn biết điều đó, nhưng đôi khi nó đáng để nêu ra. Cảm ơn rất nhiều!
BurninLeo

1
(+1) Câu trả lời thực sự tốt đẹp.
chl 18/12/13

2

Một lời thú nhận thú vị mà tôi đã học được trong lớp thống kê sinh học ban đầu của mình từ một giáo sư là mức ý nghĩa 0,05 được đưa ra thông qua một sự đồng thuận thay vì sự thật vàng. Kể từ đó, tôi đã thấy các tài liệu tán tỉnh với mức ý nghĩa 0,05, chẳng hạn như "tiếp cận" vẫn là một phát hiện nổi bật của nghiên cứu và tôi đã nghe thấy các lập luận rằng mức ý nghĩa 0,05 có thể không áp dụng cho tất cả các lĩnh vực nghiên cứu. Như đã nói, tôi đã tìm thấy các ước tính điểm và khoảng tin cậy sẽ có nhiều thông tin hơn mức ý nghĩa. Đây là một bài viết thú vị về vấn đề này (với tôi dù thế nào).


Cảm ơn bạn đã tham khảo @ user2300643. Và cảm ơn vì đã tránh được rào cản tài chính để tiếp cận!
doug.numbers

Có một cuộc thảo luận thú vị về nguồn gốc của mức ý nghĩa 5% vv ở đây .
Glen_b -Reinstate Monica

0

Giá trị của p thường được đặt cho sự đồng thuận như đã nói trước đây (hay đúng hơn là sự lười biếng). Để thực sự có thể nói rằng một cái gì đó có ý nghĩa, chúng ta phải tìm giá trị của p tương ứng với kích thước hiệu ứng, kích thước mẫu và mức độ nghiêm ngặt mà bạn muốn nó đối với dữ liệu của bạn. Đây được gọi là phân tích sức mạnh (nó là một trường con trong thống kê). Nhiều người không biết hoặc đơn giản là không sử dụng nó vì nó không đơn giản. Điều này không có nghĩa là nó ổn theo cách của nó. Chúng ta nên luôn luôn thực hiện loại nghiên cứu này để rút ra những suy luận thực sự có ý nghĩa.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.