Tôi đang cố gắng giải quyết câu hỏi sau:
Người chơi A thắng 17 trên 25 trận trong khi người chơi B thắng 8 trên 20 - có sự khác biệt đáng kể giữa cả hai tỷ lệ không?
Điều cần làm trong R mà bạn nghĩ đến là:
> prop.test(c(17,8),c(25,20),correct=FALSE)
2-sample test for equality of proportions without continuity correction
data: c(17, 8) out of c(25, 20)
X-squared = 3.528, df = 1, p-value = 0.06034
alternative hypothesis: two.sided
95 percent confidence interval:
-0.002016956 0.562016956
sample estimates:
prop 1 prop 2
0.68 0.40
Vì vậy, thử nghiệm này nói rằng sự khác biệt không đáng kể ở mức độ tin cậy 95%.
Bởi vì chúng tôi biết rằng prop.test()
chỉ sử dụng một phép tính gần đúng, tôi muốn làm cho mọi thứ chính xác hơn bằng cách sử dụng một phép thử nhị thức chính xác - và tôi thực hiện cả hai cách:
> binom.test(x=17,n=25,p=8/20)
Exact binomial test
data: 17 and 25
number of successes = 17, number of trials = 25, p-value = 0.006693
alternative hypothesis: true probability of success is not equal to 0.4
95 percent confidence interval:
0.4649993 0.8505046
sample estimates:
probability of success
0.68
> binom.test(x=8,n=20,p=17/25)
Exact binomial test
data: 8 and 20
number of successes = 8, number of trials = 20, p-value = 0.01377
alternative hypothesis: true probability of success is not equal to 0.68
95 percent confidence interval:
0.1911901 0.6394574
sample estimates:
probability of success
0.4
Bây giờ điều này là lạ, phải không? Các giá trị p hoàn toàn khác nhau mỗi lần! Trong cả hai trường hợp, kết quả bây giờ rất cao nhưng giá trị p dường như tăng vọt.
Những câu hỏi của tôi
- Tại sao các p-giá trị đó khác nhau mỗi lần?
- Làm thế nào để thực hiện một phép thử nhị phân tỷ lệ mẫu chính xác trong R một cách chính xác?
prop.test
vschisq.test
), nhưng cùng một khái niệm cơ bản nằm trong câu hỏi này . Bạn đang chạy ba bài kiểm tra khác nhau với "giả thuyết không" khác nhau trong mỗi ba ví dụ của bạn.