Giá trị P được xác định xác suất đạt được thống kê kiểm tra ít nhất là cực đoan như những gì được quan sát, giả sử null giả thuyết là đúng. Nói cách khác,
set.seed(0)
# Generate bi-modal distribution
bimodal <- c(rnorm(n=100,mean=25,sd=3),rnorm(n=100,mean=100,sd=5))
hist(bimodal, breaks=100)
Và giả sử chúng ta quan sát giá trị thống kê kiểm tra là 60. Và ở đây chúng ta biết từ hình ảnh giá trị này rất khó xảy ra . Rất lý tưởng, tôi muốn một quy trình thống kê mà tôi sử dụng (giả sử giá trị p) để tiết lộ điều này. Nhưng nếu chúng ta tính toán giá trị p như được xác định, chúng ta sẽ nhận được giá trị p khá cao
observed <- 60
# Get P-value
sum(bimodal[bimodal >= 60])/sum(bimodal)
[1] 0.7991993
Nếu tôi không biết phân phối, tôi sẽ kết luận rằng những gì tôi quan sát được chỉ đơn giản là do cơ hội ngẫu nhiên. Nhưng chúng tôi biết điều này không đúng.
Tôi đoán câu hỏi tôi có là: Tại sao, khi tính toán giá trị p, chúng ta có tính toán xác suất cho các giá trị "ít nhất là cực kỳ như" quan sát được không? Và nếu tôi gặp phải một tình huống như tình huống tôi mô phỏng ở trên, giải pháp thay thế là gì?