Thật dễ dàng để tính xác suất để thực hiện quan sát đó, thực tế là hai đồng tiền bằng nhau. Điều này có thể được thực hiện bằng thử nghiệm chính xác của Fishers . Đưa ra những quan sát
headstailscoin 1H1n1−H1coin 2H2n2−H2
xác suất để quan sát những con số này trong khi các đồng xu bằng nhau với số lần thử n1 , n2 và tổng số đầu H1+H2 là
p(H1,H2|n1,n2,H1+H2)=(H1+H2)!(n1+n2−H1−H2)!n1!n2!H1!H2!(n1−H1)!(n2−H2)!(n1+n2)!.
Nhưng những gì bạn đang yêu cầu là xác suất một đồng tiền tốt hơn. Vì chúng tôi tranh luận về một niềm tin về mức độ thiên vị của các đồng tiền, chúng tôi phải sử dụng phương pháp Bayes để tính kết quả. Xin lưu ý rằng trong suy luận Bayes, thuật ngữ niềm tin được mô hình hóa như xác suất và hai thuật ngữ được sử dụng thay thế cho nhau (s. Xác suất Bayes ). Chúng tôi gọi xác suất là đồng xu i ném đầu pi . Phân phối sau sau khi quan sát, cho pi này được đưa ra bởi định lý Bayes :
f(pi|Hi,ni)=f(Hi|pi,ni)f(pi)f(ni,Hi)
Hàm mật độ xác suất (pdf)f(Hi|pi,ni)được đưa ra bởi xác suất Binomial, vì các lần thử riêng lẻ là các thí nghiệm Bernoulli:
Tôigiả sửkiến thức trước vềlàcó thể nằm ở bất kỳ đâu giữavàvới xác suất bằng nhau, do đó. Vì vậy, người đề cử làf(Hi|pi,ni)=(niHi)pHii(1−pi)ni−Hi
f(pi)pi01f(pi)=1f(Hi|pi,ni)f(pi)=f(Hi|pi,nif(pi)pi01f(pi)=1f(Hi|pi,ni)f(pi)=f(Hi|pi,ni) .
Để tính chúng tôi sử dụng thực tế là tích phân trên pdf phải là một . Vì vậy mẫu số sẽ là một yếu tố không đổi để đạt được điều đó. Có một pdf được biết đến khác với người được chỉ định bởi một yếu tố không đổi, đó là phân phối beta . Do đó
f(ni,Hi)∫10f(p|Hi,ni)dp=1f ( p i | H i , n i ) = 1f(pi|Hi,ni)=1B(Hi+1,ni−Hi+1)pHii(1−pi)ni−Hi.
Pdf cho cặp xác suất của các đồng tiền độc lập là
f(p1,p2|H1,n1,H2,n2)=f(p1|H1,n1)f(p2|H2,n2).
Bây giờ chúng ta cần tích hợp điều này vào các trường hợp trong đó để tìm hiểu xem đồng xu có thể tốt hơn thế nào sau đó xu :
p1>p212P(p1>p2)=∫10∫p‘10f(p‘1,p‘2|H1,n1,H2,n2)dp‘2dp‘1=∫10B(p‘1;H2+1,n2−H2+1)B(H2+1,n2−H2+1)f(p‘1|H1,n1)dp‘1
Tôi không thể giải quyết tích phân cuối cùng này nhưng người ta có thể giải nó bằng máy tính sau khi cắm các con số. là chức năng beta và là chức năng beta chưa hoàn thành. Lưu ý rằng vì là biến tiếp tục và không bao giờ chính xác như .B(⋅,⋅)B(⋅;⋅,⋅)P(p1=p2)=0p1p2
Liên quan đến giả định trước về và nhận xét về nó: Một lựa chọn tốt cho mô hình mà nhiều người tin là sử dụng bản phân phối . Điều này sẽ dẫn đến xác suất cuối cùng
Bằng cách đó, người ta có thể mô hình một xu hướng mạnh mẽ đối với các đồng tiền thông thường bằng , . Nó sẽ tương đương với việc tung đồng xu thêm lần và nhận được đầu do đó tương đương với việc chỉ có nhiều dữ liệu hơn. là số lần tung mà chúng ta sẽ không phải thực hiệnf(pi)Beta(ai+1,bi+1)P(p1>p2)=∫10B(p‘1;H2+1+a2,n2−H2+1+b2)B(H2+1+a2,n2−H2+1+b2)f(p‘1|H1+a1,n1+a1+b1)dp‘1.
aibiai+biaiai+bi nếu chúng tôi bao gồm điều này trước.
OP tuyên bố rằng hai đồng tiền đều thiên vị ở một mức độ không xác định. Vì vậy, tôi hiểu tất cả các kiến thức phải được suy luận từ các quan sát. Đây là lý do tại sao tôi đã chọn một loại thuốc không thông tin trước đó mà không làm sai lệch kết quả, ví dụ như đối với các đồng tiền thông thường.
Tất cả thông tin có thể được chuyển tải dưới dạng trên mỗi đồng tiền. Việc thiếu một thông tin trước chỉ có nghĩa là cần nhiều quan sát hơn để quyết định đồng tiền nào tốt hơn với xác suất cao.(Hi,ni)
Đây là mã trong R cung cấp hàm bằng cách sử dụng đồng phục trước :
P(n1, H1, n2, H2)
=P(p1>p2)f(pi)=1
mp <- function(p1, n1, H1, n2, H2) {
f1 <- pbeta(p1, H2 + 1, n2 - H2 + 1)
f2 <- dbeta(p1, H1 + 1, n1 - H1 + 1)
return(f1 * f2)
}
P <- function(n1, H1, n2, H2) {
return(integrate(mp, 0, 1, n1, H1, n2, H2))
}
Bạn có thể vẽ cho các kết quả thử nghiệm khác nhau và cố định , , ví dụ với mã này được bắn tỉa:P(p1>p2)n1n2n1=n2=4
library(lattice)
n1 <- 4
n2 <- 4
heads <- expand.grid(H1 = 0:n1, H2 = 0:n2)
heads$P <- apply(heads, 1, function(H) P(n1, H[1], n2, H[2])$value)
levelplot(P ~ H1 + H2, heads, main = "P(p1 > p2)")
Bạn có thể cần phải install.packages("lattice")
đầu tiên.
Mọi người có thể thấy, ngay cả với đồng phục trước và cỡ mẫu nhỏ, xác suất hoặc tin rằng một đồng xu tốt hơn có thể trở nên khá vững chắc, khi và đủ khác nhau. Một sự khác biệt tương đối thậm chí nhỏ hơn là cần thiết nếu và thậm chí còn lớn hơn. Đây là một âm mưu cho và :H1H2n1n2n1=100n2=200
Martijn Weterings đề nghị tính toán phân phối xác suất sau cho sự khác biệt giữa và . Điều này có thể được thực hiện bằng cách tích hợp pdf của cặp trên tập :
p1p2S(d)={(p1,p2)∈[0,1]2|d=|p1−p2|}f(d|H1,n1,H2,n2)=∫S(d)f(p1,p2|H1,n1,H2,n2)dγ=∫1−d0f(p,p+d|H1,n1,H2,n2)dp+∫1df(p,p−d|H1,n1,H2,n2)dp
Một lần nữa, không phải là một tích phân tôi có thể giải quyết một cách phân tích nhưng mã R sẽ là:
d1 <- function(p, d, n1, H1, n2, H2) {
f1 <- dbeta(p, H1 + 1, n1 - H1 + 1)
f2 <- dbeta(p + d, H2 + 1, n2 - H2 + 1)
return(f1 * f2)
}
d2 <- function(p, d, n1, H1, n2, H2) {
f1 <- dbeta(p, H1 + 1, n1 - H1 + 1)
f2 <- dbeta(p - d, H2 + 1, n2 - H2 + 1)
return(f1 * f2)
}
fd <- function(d, n1, H1, n2, H2) {
if (d==1) return(0)
s1 <- integrate(d1, 0, 1-d, d, n1, H1, n2, H2)
s2 <- integrate(d2, d, 1, d, n1, H1, n2, H2)
return(s1$value + s2$value)
}
Tôi đã vẽ cho , , và tất cả các giá trị của :f(d|n1,H1,n2,H2)n1=4H1=3n2=4H2
n1 <- 4
n2 <- 4
H1 <- 3
d <- seq(0, 1, length = 500)
get_f <- function(H2) sapply(d, fd, n1, H1, n2, H2)
dat <- sapply(0:n2, get_f)
matplot(d, dat, type = "l", ylab = "Density",
main = "f(d | 4, 3, 4, H2)")
legend("topright", legend = paste("H2 =", 0:n2),
col = 1:(n2 + 1), pch = "-")
Bạn có thể tính xác suất củađể được trên một giá trị bởi . Lưu ý rằng ứng dụng kép của tích phân số đi kèm với một số lỗi số. Ví dụ: luôn luôn phải bằng vì luôn lấy giá trị từ đến . Nhưng kết quả thường sai lệch một chút.|p1−p2|d1 d 0 1integrate(fd, d, 1, n1, H1, n2, H2)
integrate(fd, 0, 1, n1, H1, n2, H2)
1d01