Thử nghiệm của Barnard được sử dụng khi tham số phiền toái không xác định theo giả thuyết null.
Tuy nhiên, trong thử nghiệm nếm thử phụ nữ, bạn có thể lập luận rằng tham số phiền toái có thể được đặt ở mức 0,5 theo giả thuyết null (người phụ nữ không hiểu biết có xác suất 50% để đoán chính xác một cốc).
Sau đó, số lần đoán đúng, theo giả thuyết null, trở thành phân phối nhị thức: đoán 8 cốc với xác suất 50% cho mỗi cốc.
Trong những trường hợp khác, bạn có thể không có xác suất 50% tầm thường này cho giả thuyết khống. Và không có lợi nhuận cố định, bạn có thể không biết xác suất đó là bao nhiêu. Trong trường hợp đó, bạn cần thử nghiệm của Barnard.
Ngay cả khi bạn thực hiện thử nghiệm của Barnard trong thử nghiệm nếm trà của phụ nữ, dù sao nó cũng sẽ trở thành 50% (nếu kết quả là tất cả các dự đoán chính xác) vì tham số phiền toái có giá trị p cao nhất là 0,5 và sẽ dẫn đến thử nghiệm nhị thức tầm thường ( nó thực sự là sự kết hợp của hai thử nghiệm nhị thức một cho bốn cốc sữa đầu tiên và một cho bốn cốc trà đầu tiên).
> library(Barnard)
> barnard.test(4,0,0,4)
Barnard's Unconditional Test
Treatment I Treatment II
Outcome I 4 0
Outcome II 0 4
Null hypothesis: Treatments have no effect on the outcomes
Score statistic = -2.82843
Nuisance parameter = 0.5 (One sided), 0.5 (Two sided)
P-value = 0.00390625 (One sided), 0.0078125 (Two sided)
> dbinom(8,8,0.5)
[1] 0.00390625
> dbinom(4,4,0.5)^2
[1] 0.00390625
Dưới đây là cách nó sẽ dẫn đến một kết quả phức tạp hơn (nếu không phải tất cả các dự đoán đều đúng, ví dụ 2 so với 4), thì việc đếm những gì là và không cực đoan trở nên khó khăn hơn một chút
(Lưu ý rằng thử nghiệm của Barnard sử dụng, trong trường hợp kết quả 4-2, tham số phiền toái p = 0,686 mà bạn có thể tranh luận là không chính xác, giá trị p cho xác suất 50% trả lời 'trà trước' sẽ là 0,08203125. Điều này càng trở nên nhỏ hơn khi bạn xem xét một khu vực khác, thay vào đó là khu vực dựa trên thống kê của Wald, mặc dù việc xác định khu vực này không quá dễ dàng )
out <- rep(0,1000)
for (k in 1:1000) {
p <- k/1000
ps <- matrix(rep(0,25),5) # probability for outcome i,j
ts <- matrix(rep(0,25),5) # distance of outcome i,j (using wald statistic)
for (i in 0:4) {
for (j in 0:4) {
ps[i+1,j+1] <- dbinom(i,4,p)*dbinom(j,4,p)
pt <- (i+j)/8
p1 <- i/4
p2 <- j/4
ts[i+1,j+1] <- (p2-p1)/sqrt(pt*(1-pt)*(0.25+0.25))
}
}
cases <- ts < ts[2+1,4+1]
cases[1,1] = TRUE
cases[5,5] = TRUE
ps
out[k] <- 1-sum(ps[cases])
}
> max(out)
[1] 0.08926748
> barnard.test(4,2,0,2)
Barnard's Unconditional Test
Treatment I Treatment II
Outcome I 4 2
Outcome II 0 2
Null hypothesis: Treatments have no effect on the outcomes
Score statistic = -1.63299
Nuisance parameter = 0.686 (One sided), 0.314 (Two sided)
P-value = 0.0892675 (One sided), 0.178535 (Two sided)