Với xác suất nào thì một đồng xu tốt hơn đồng tiền kia?


8

Giả sử chúng ta có hai đồng xu thiên vị C1C2cả hai đều có xác suất quay đầu khác nhau.

Chúng ta quăng C1 n1lần và nhận H1đầu, C2 n2lần và nhận H2đầu. Và chúng tôi thấy rằng tỷ lệ người đứng đầu cho một đồng tiền này cao hơn so với người khác.

Xác suất mà chúng ta có thể nói rằng một đồng tiền tốt hơn đồng tiền kia là bao nhiêu? (tốt hơn ở đây có nghĩa là xác suất quay đầu thực tế cao hơn).


2
Đây không phải là một vấn đề kiểm tra giả thuyết mà bạn phải kiểm tra xem các ước tính xác suất quay đầu của các đồng tiền có khác nhau không.
ngây thơ

3
Nếu bạn muốn một xác suất rằng một đồng tiền tốt hơn một đồng tiền khác, bạn có thể làm điều đó với cách tiếp cận Bayes; tất cả những gì bạn cần là một phân phối trước về xác suất. Đó là một tính toán khá đơn giản.
Glen_b -Reinstate Monica

2
Không có cách nào mà dữ liệu này sẽ cung cấp cho bạn một xác suất rằng một đồng tiền này tốt hơn một đồng tiền khác . Bạn cần thêm thông tin / giả định về phân phối trước cho cách phân phối tiền. Nói theo cách tiếp cận Bayes thì kết quả sẽ khác rất nhiều dựa trên các giả định trước đó của bạn. Chẳng hạn, nếu những đồng tiền đó là những đồng tiền thông thường hơn so với chúng (một tiên nghiệm) rất có thể bằng nhau và bạn sẽ cần một số lượng lớn các thử nghiệm để tìm xác suất hợp lý rằng một đồng tiền 'tốt hơn' (vì xác suất cao là bạn nhận được hai đồng tiền tương tự mà vô tình kiểm tra khác nhau)
Sextus Empiricus

1
@katosh, nó chính xác như trước. Giả sử bạn có tiền giữa p = 0,49 và p = 0,51. Nếu trong trường hợp như vậy, bạn sử dụng giả định rằng các đồng tiền được phân phối đồng đều giữa 0 và 1, thì xác suất mà bạn gán giống như các giả định xấu được cập nhật hơn là xác suất cập nhật. Bạn sẽ thường xuyên chỉ định xác suất cao là 'tốt hơn' cho đồng tiền sai. Sẽ là sai lầm khi coi kết quả là 'xác suất' cho đồng xu 'tốt hơn' so với loại khác. Dữ liệu xấu trong = kết quả xấu ra. Trong bài toán này, chúng ta không nên làm việc với việc giải toán mà là giải quyết kiến ​​thức.
Sextus Empiricus

1
Theo cách đó, nó được nêu chính xác. Đó là một "niềm tin" và điều này không dễ dàng tương đương với một "xác suất".
Sextus Empiricus

Câu trả lời:


7

Thật dễ dàng để tính xác suất để thực hiện quan sát đó, thực tế là hai đồng tiền bằng nhau. Điều này có thể được thực hiện bằng thử nghiệm chính xác của Fishers . Đưa ra những quan sát

coin 1coin 2headsH1H2tailsn1H1n2H2

xác suất để quan sát những con số này trong khi các đồng xu bằng nhau với số lần thử n1 , n2 và tổng số đầu H1+H2

p(H1,H2|n1,n2,H1+H2)=(H1+H2)!(n1+n2H1H2)!n1!n2!H1!H2!(n1H1)!(n2H2)!(n1+n2)!.

Nhưng những gì bạn đang yêu cầu là xác suất một đồng tiền tốt hơn. Vì chúng tôi tranh luận về một niềm tin về mức độ thiên vị của các đồng tiền, chúng tôi phải sử dụng phương pháp Bayes để tính kết quả. Xin lưu ý rằng trong suy luận Bayes, thuật ngữ niềm tin được mô hình hóa như xác suất và hai thuật ngữ được sử dụng thay thế cho nhau (s. Xác suất Bayes ). Chúng tôi gọi xác suất là đồng xu i ném đầu pi . Phân phối sau sau khi quan sát, cho pi này được đưa ra bởi định lý Bayes :

f(pi|Hi,ni)=f(Hi|pi,ni)f(pi)f(ni,Hi)
Hàm mật độ xác suất (pdf)f(Hi|pi,ni)được đưa ra bởi xác suất Binomial, vì các lần thử riêng lẻ là các thí nghiệm Bernoulli: Tôigiả sửkiến thức trước vềlàcó thể nằm ở bất kỳ đâu giữavàvới xác suất bằng nhau, do đó. Vì vậy, người đề cử là
f(Hi|pi,ni)=(niHi)piHi(1pi)niHi
f(pi)pi01f(pi)=1f(Hi|pi,ni)f(pi)=f(Hi|pi,nif(pi)pi01f(pi)=1f(Hi|pi,ni)f(pi)=f(Hi|pi,ni) .

Để tính chúng tôi sử dụng thực tế là tích phân trên pdf phải là một . Vì vậy mẫu số sẽ là một yếu tố không đổi để đạt được điều đó. Có một pdf được biết đến khác với người được chỉ định bởi một yếu tố không đổi, đó là phân phối beta . Do đó f(ni,Hi)01f(p|Hi,ni)dp=1f ( p i | H i , n i ) = 1

f(pi|Hi,ni)=1B(Hi+1,niHi+1)piHi(1pi)niHi.

Pdf cho cặp xác suất của các đồng tiền độc lập là

f(p1,p2|H1,n1,H2,n2)=f(p1|H1,n1)f(p2|H2,n2).

Bây giờ chúng ta cần tích hợp điều này vào các trường hợp trong đó để tìm hiểu xem đồng xu có thể tốt hơn thế nào sau đó xu : p1>p212

P(p1>p2)=010p1f(p1,p2|H1,n1,H2,n2)dp2dp1=01B(p1;H2+1,n2H2+1)B(H2+1,n2H2+1)f(p1|H1,n1)dp1

Tôi không thể giải quyết tích phân cuối cùng này nhưng người ta có thể giải nó bằng máy tính sau khi cắm các con số. là chức năng beta và là chức năng beta chưa hoàn thành. Lưu ý rằng vì là biến tiếp tục và không bao giờ chính xác như .B(,)B(;,)P(p1=p2)=0p1p2


Liên quan đến giả định trước về và nhận xét về nó: Một lựa chọn tốt cho mô hình mà nhiều người tin là sử dụng bản phân phối . Điều này sẽ dẫn đến xác suất cuối cùng Bằng cách đó, người ta có thể mô hình một xu hướng mạnh mẽ đối với các đồng tiền thông thường bằng , . Nó sẽ tương đương với việc tung đồng xu thêm lần và nhận được đầu do đó tương đương với việc chỉ có nhiều dữ liệu hơn. là số lần tung mà chúng ta sẽ không phải thực hiệnf(pi)Beta(ai+1,bi+1)

P(p1>p2)=01B(p1;H2+1+a2,n2H2+1+b2)B(H2+1+a2,n2H2+1+b2)f(p1|H1+a1,n1+a1+b1)dp1.
aibiai+biaiai+bi nếu chúng tôi bao gồm điều này trước.

OP tuyên bố rằng hai đồng tiền đều thiên vị ở một mức độ không xác định. Vì vậy, tôi hiểu tất cả các kiến ​​thức phải được suy luận từ các quan sát. Đây là lý do tại sao tôi đã chọn một loại thuốc không thông tin trước đó mà không làm sai lệch kết quả, ví dụ như đối với các đồng tiền thông thường.

Tất cả thông tin có thể được chuyển tải dưới dạng trên mỗi đồng tiền. Việc thiếu một thông tin trước chỉ có nghĩa là cần nhiều quan sát hơn để quyết định đồng tiền nào tốt hơn với xác suất cao.(Hi,ni)


Đây là mã trong R cung cấp hàm bằng cách sử dụng đồng phục trước : P(n1, H1, n2, H2) =P(p1>p2)f(pi)=1

mp <- function(p1, n1, H1, n2, H2) {
    f1 <- pbeta(p1, H2 + 1, n2 - H2 + 1)
    f2 <- dbeta(p1, H1 + 1, n1 - H1 + 1)
    return(f1 * f2)
}

P <- function(n1, H1, n2, H2) {
    return(integrate(mp, 0, 1, n1, H1, n2, H2))
}

Bạn có thể vẽ cho các kết quả thử nghiệm khác nhau và cố định , , ví dụ với mã này được bắn tỉa:P(p1>p2)n1n2n1=n2=4

library(lattice)
n1 <- 4
n2 <- 4
heads <- expand.grid(H1 = 0:n1, H2 = 0:n2)
heads$P <- apply(heads, 1, function(H) P(n1, H[1], n2, H[2])$value)
levelplot(P ~ H1 + H2, heads, main = "P(p1 > p2)")

P (p1> p2) cho n1 = n2 = 4

Bạn có thể cần phải install.packages("lattice")đầu tiên.

Mọi người có thể thấy, ngay cả với đồng phục trước và cỡ mẫu nhỏ, xác suất hoặc tin rằng một đồng xu tốt hơn có thể trở nên khá vững chắc, khi và đủ khác nhau. Một sự khác biệt tương đối thậm chí nhỏ hơn là cần thiết nếu và thậm chí còn lớn hơn. Đây là một âm mưu cho và :H1H2n1n2n1=100n2=200

nhập mô tả hình ảnh ở đây


Martijn Weterings đề nghị tính toán phân phối xác suất sau cho sự khác biệt giữa và . Điều này có thể được thực hiện bằng cách tích hợp pdf của cặp trên tập : p1p2S(d)={(p1,p2)[0,1]2|d=|p1p2|}

f(d|H1,n1,H2,n2)=S(d)f(p1,p2|H1,n1,H2,n2)dγ=01df(p,p+d|H1,n1,H2,n2)dp+d1f(p,pd|H1,n1,H2,n2)dp

Một lần nữa, không phải là một tích phân tôi có thể giải quyết một cách phân tích nhưng mã R sẽ là:

d1 <- function(p, d, n1, H1, n2, H2) {
    f1 <- dbeta(p, H1 + 1, n1 - H1 + 1)
    f2 <- dbeta(p + d, H2 + 1, n2 - H2 + 1)
    return(f1 * f2)
}

d2 <- function(p, d, n1, H1, n2, H2) {
    f1 <- dbeta(p, H1 + 1, n1 - H1 + 1)
    f2 <- dbeta(p - d, H2 + 1, n2 - H2 + 1)
    return(f1 * f2)
}

fd <- function(d, n1, H1, n2, H2) {
    if (d==1) return(0)
    s1 <- integrate(d1, 0, 1-d, d, n1, H1, n2, H2)
    s2 <- integrate(d2, d, 1, d, n1, H1, n2, H2)
    return(s1$value + s2$value)
}

Tôi đã vẽ cho , , và tất cả các giá trị của :f(d|n1,H1,n2,H2)n1=4H1=3n2=4H2

n1 <- 4
n2 <- 4
H1 <- 3
d <- seq(0, 1, length = 500)

get_f <- function(H2) sapply(d, fd, n1, H1, n2, H2)
dat <- sapply(0:n2, get_f)

matplot(d, dat, type = "l", ylab = "Density",
        main = "f(d | 4, 3, 4, H2)")
legend("topright", legend = paste("H2 =", 0:n2),
       col = 1:(n2 + 1), pch = "-")

nhập mô tả hình ảnh ở đây

Bạn có thể tính xác suất củađể được trên một giá trị bởi . Lưu ý rằng ứng dụng kép của tích phân số đi kèm với một số lỗi số. Ví dụ: luôn luôn phải bằng vì luôn lấy giá trị từ đến . Nhưng kết quả thường sai lệch một chút.|p1p2|d1 d 0 1integrate(fd, d, 1, n1, H1, n2, H2)integrate(fd, 0, 1, n1, H1, n2, H2)1d01


Tôi không biết giá trị thực của p1
Thirupathi Thangavel

1
Tôi xin lỗi vì ký hiệu xấu của tôi nhưng bạn không cần phải cắm một giá trị cố định cho . (hiện đã thay đổi) trong tích phân là biến bạn tích hợp. Giống như bạn có thể tích hợp mà không có giá trị cố định cho . p ' 1 1 0 x 2 d x xp1p101x2dxx
katosh

1
Kiểm tra chính xác của Fisher cụ thể hơn về giả thuyết rằng các đồng tiền có cùng xác suất tổng số biên được cố định . Đây không phải là trường hợp trong vấn đề tiền xu này. Nếu bạn làm lại bài kiểm tra thì bạn có thể quan sát một số lượng đầu khác.
Sextus Empiricus

@MartijnWeterings trong trường hợp của tôi, xác suất quay đầu cho một đồng tiền luôn được cố định. Như vậy vẫn chưa đủ?
Thirupathi Thangavel

1
@ThirupathiThangavel vấn đề với bài kiểm tra của Fisher là về tổng số biên không cố định. Mô hình thử nghiệm chính xác giả định rằng xác suất của các đầu là giống nhau và cố định, nhưng cũng có các biên được cố định trước khi thử nghiệm. Đó là phần thứ hai không phải là trường hợp. Điều này đưa ra một xác suất có điều kiện khác nhau cho các giá trị cực đoan. Nhìn chung, bài kiểm tra Fisher sẽ được bảo thủ. Xác suất của kết quả đưa ra giả thuyết TRUE (nghĩa là xác suất cố định và tương tự cho các đầu, nhưng không nhất thiết là tổng biên cố định) nhỏ hơn tính toán (bạn nhận được giá trị p cao hơn).
Sextus Empiricus

2

Tôi đã thực hiện một mô phỏng số với R, có lẽ bạn đang tìm kiếm một câu trả lời phân tích, nhưng tôi nghĩ rằng điều này có thể thú vị để chia sẻ.

set.seed(123)
# coin 1
N1 = 20
theta1 = 0.7

toss1 <- rbinom(n = N1, size = 1, prob = theta1)

# coin 2
N2 = 25
theta2 = 0.5

toss2 <- rbinom(n = N2, size = 1, prob = theta2)

# frequency
sum(toss1)/N1 # [1] 0.65
sum(toss2)/N2 # [1] 0.52

Trong mã đầu tiên này, tôi chỉ đơn giản là mô phỏng hai lần tung đồng xu. Ở đây bạn có thể thấy tất nhiên là nó theta1 > theta2, sau đó tất nhiên tần số H1sẽ cao hơn H2. Lưu ý khác nhau N1, N2kích cỡ.

Hãy xem những gì chúng ta có thể làm với khác nhau thetas. Lưu ý mã không tối ưu. Ở tất cả.

simulation <- function(N1, N2, theta1, theta2, nsim = 100) {
  count1 <- count2 <- 0

  for (i in 1:nsim) {
    toss1 <- rbinom(n = N1, size = 1, prob = theta1)
    toss2 <- rbinom(n = N2, size = 1, prob = theta2)

    if (sum(toss1)/N1 > sum(toss2)/N2) {count1 = count1 + 1} 
    #if (sum(toss1)/N1 < sum(toss2)/N2) {count2 = count2 + 1} 
  }

  count1/nsim

}
set.seed(123)
simulation(20, 25, 0.7, 0.5, 100)
#[1] 0.93

Vì vậy, 0,93 là tần số lần (trong số 100) mà đồng tiền đầu tiên có nhiều đầu hơn. Điều này có vẻ ổn, nhìn vào theta1theta2sử dụng.

Chúng ta hãy xem với hai vectơ của thetas.

theta1_v <- seq(from = 0.1, to = 0.9, by = 0.1)
theta2_v <- seq(from = 0.9, to = 0.1, by = -0.1)

res_v <- c()
for (i in 1:length(theta1_v)) {

  res <- simulation(1000, 1500, theta1_v[i], theta2_v[i], 100)
  res_v[i] <- res

}

plot(theta1_v, res_v, type = "l")

Hãy nhớ rằng đó res_vlà tần số H1 > H2trong số 100 mô phỏng.

nhập mô tả hình ảnh ở đây

Vì vậy, khi theta1tăng, thì xác suất H1tăng cao hơn, tất nhiên.

Tôi đã thực hiện một số mô phỏng khác và dường như kích thước N1, N2ít quan trọng hơn.

Nếu bạn quen thuộc với Rbạn, bạn có thể sử dụng mã này để làm sáng tỏ vấn đề. Tôi biết đây không phải là một phân tích đầy đủ và nó có thể được cải thiện.


2
Thú vị res_vthay đổi liên tục khi thetas gặp nhau. Tôi hiểu câu hỏi khi nó hỏi về xu hướng nội tại của đồng tiền sau khi chỉ thực hiện một quan sát duy nhất. Bạn dường như trả lời những gì quan sát người ta sẽ làm sau khi biết sai lệch.
katosh
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.