Bạn đang nhận được câu trả lời tốt ở đây từ @MansT & @ gui11aume (+1 cho mỗi). Hãy để tôi xem nếu tôi có thể nhận được rõ ràng hơn ở một cái gì đó trong cả hai câu trả lời của họ.
Khi làm việc với dữ liệu rời rạc , chỉ có một số giá trị p nhất định có thể và vấn đề trở nên tồi tệ hơn với ít khả năng / bộ dữ liệu nhỏ hơn. Ví dụ, tưởng tượng lật một đồng xu lần. Xác suất nhận được một số lượng đầu cụ thể, , là:
Hãy nói rằng một nhà nghiên cứu muốn để kiểm tra một đồng tiền nhất định (mà thực sự là công bằng) cho sự công bằng bằng cách lật nó 10 lần và ghi lại số lượng người đứng đầu. Đó là, giả thuyết null là đúng ở đây. Nhà nghiên cứu của chúng tôi đặtk p ( k ) = n !nkα=.05
p ( k ) = n !k ! ( n - k ) !pk( 1 - p )n - k
α = 0,05, theo quy ước và bởi vì đó là những gì cần thiết để được cộng đồng lớn hơn chấp nhận. Bây giờ, bỏ qua alpha thông thường trong giây lát, hãy xem xét các giá trị p 2 đuôi (tỷ lệ lỗi loại I) có thể xảy ra trong tình huống này:
number of heads: 0 1 2 3 4 5 6 7 8 9 10
individual probability: .001 .010 .044 .117 .205 .246 .205 .117 .044 .010 .001
type I error rate: .002 .021 .109 .344 .754 1 .754 .344 .109 .021 .002
Điều này chứng tỏ rằng việc sử dụng sẽ dẫn đến tỷ lệ lỗi loại I 2 đuôi dài hạn là . Vì vậy, đây rõ ràng là một trường hợp , tuy nhiên, nếu được đặt thành một trong các giá trị ở trên ( thay vì của ) thì mức ý nghĩa sẽ bằng tỷ lệ lỗi loại I. Mặc dù vấn đề đó, giá trị p không bằng tỷ lệ lỗi loại I trong trường hợp này. Lưu ý rằng không có vấn đề nào ở đây với sự không phù hợp giữa thống kê suy luận rời rạc và phân phối tham chiếu liên tục, bởi vì tôi đã sử dụng chính xác0,021 α ≠ loại I lỗi alpha .05α = 0,05.021alpha ≠ loại I lỗiα0,05xác suất nhị thức. Lưu ý thêm rằng các tình huống như thế này đã thúc đẩy sự phát triển của giá trị p giữa để giúp giảm thiểu sự khác biệt giữa giá trị p và mức ý nghĩa.
Có thể có trường hợp giá trị p được tính không bằng tỷ lệ lỗi loại I dài hạn, ngoài thực tế là tỷ lệ lỗi loại I không nhất thiết phải bằng mức ý nghĩa. Hãy xem xét một bảng dự phòng 2x2 với các số đếm được quan sát:
col1 col2
row1 2 4
row2 4 2
Bây giờ, tôi nên tính giá trị p cho tính độc lập của các hàng và cột như thế nào? Có nhiều lựa chọn (mà tôi thảo luận ở đây ). Tôi sẽ bắt đầu bằng cách tính toán thống kê và so sánh nó với phân phối tham chiếu của nó; mang lại . Các phân phối tài liệu tham khảo là liên tục, tuy nhiên, và vì vậy chỉ một xấp xỉ như thế nào cụ thể (rời rạc) này Thống kê sẽ cư xử. Chúng tôi có thể sử dụng thử nghiệm chính xác của Fisher để xác định tỷ lệ lỗi loại I thực sự; sau đó tôi nhận đượcχ2 χ 2 χ 2 p=0,56710,5637≠0,5671χ21= 1,3 , p = .248χ2χ2p = .5671. Khi giá trị p được tính theo cách này, nó sẽ bằng với tỷ lệ lỗi loại I, mặc dù chúng ta vẫn có câu hỏi liệu một trong các giá trị p có thể có chính xác là 5% hay không. Hãy để tôi thừa nhận rằng tôi đã lừa dối một chút, nếu tôi đã sử dụng hiệu chỉnh của Yates cho tính liên tục, tôi sẽ có được xấp xỉ tốt hơn về tỷ lệ lỗi loại I thực sự, nhưng nó vẫn không hoàn toàn đúng ( ). 0,5637 ≠ 0,5671
Do đó, vấn đề ở đây là, với dữ liệu rời rạc:
- mức ý nghĩa ưa thích của bạn có thể không phải là một trong những tỷ lệ lỗi loại I có thể xảy ra, &
- sử dụng xấp xỉ (thông thường) để thống kê liên tục sẽ mang lại giá trị p được tính toán không chính xác.
Những vấn đề này càng trầm trọng hơn khi của bạn càng nhỏ . Theo tôi biết, những vấn đề này không tồn tại với dữ liệu liên tục. N
(Mặc dù câu hỏi không hỏi về giải pháp cho những vấn đề này), có những điều giảm thiểu những vấn đề này:
- lớn hơn có nghĩa là nhiều giá trị có thể hơn, làm cho mọi thứ liên tục hơn, N
- thường có các hiệu chỉnh (chẳng hạn như hiệu chỉnh liên tục của Yates) sẽ mang các giá trị được tính gần với giá trị chính xác hơn,
- các thử nghiệm chính xác (nếu có thể kéo được, nghĩa là, nếu đủ nhỏ) sẽ mang lại giá trị p chính xác N
- giá trị p giữa cung cấp khả năng đưa tỷ lệ lỗi loại I của bạn gần với mức độ tin cậy đã chọn của bạn,
- bạn rõ ràng có thể sử dụng một trong các tỷ lệ lỗi loại I tồn tại (hoặc lưu ý nó sẽ là gì).