Kết hợp các biến ngẫu nhiên nhị thức


7

(Tuyên bố từ chối trách nhiệm: Đây không phải là một câu hỏi bài tập về nhà). Tôi đang cố gắng tự dạy mình một số xác suất cơ bản và tôi nghĩ về ví dụ sau: Hãy tưởng tượng bạn đang chơi một trò chơi liên quan đến hai đồng xu. Để giành chiến thắng trong trò chơi, bạn phải lật đầu trước đối thủ của mình. Đó là, nếu họ lật đầu trước họ sẽ thắng và bạn thua. Chúng ta cũng giả sử trò chơi được chơi theo lượt và bạn sẽ lật đồng xu trước. Ngoài ra, các đồng tiền là 'không công bằng' với và .P(X=heads)|coin1=p1P(X=heads)|coin2=p2

Tôi không chắc làm thế nào để tính trung bình bao nhiêu lượt chơi để giành chiến thắng trong trò chơi.

Cho đến nay, tôi tin rằng chúng ta có thể mô hình hóa trò chơi này với chức năng sau (có vẻ rất giống với phân phối hình học), vì để giành chiến thắng trong trò chơi (giả sử bạn lật đuôi trước), đối thủ phải lật đuôi với xác suất hoặc bạn thua. Mô hình này lặp lại cho mỗi vòng của trò chơi.P(X=k)=p1(1p1)k1(1p2)k1(1p2)

Tôi tin rằng xác suất chiến thắng bằng và số lượt dự kiến để giành chiến thắng được đưa ra bởi \ sum_ {k = 1} ^ {\ inf} p_1 (1-p_1) ^ {k-1} (1-p_2) ^ {k-1} k .Σk= =1thông tinp1(1-p1)k-1(1-p2)k-1Σk= =1thông tinp1(1-p1)k-1(1-p2)k-1k

Tôi đã viết một mô phỏng Monte Carlo để tính toán các giá trị này với giả định các giá trị cho p1p2 , nhưng điều đó không thỏa đáng với tôi. Tôi muốn biết làm thế nào để giải quyết vấn đề này một cách toán học trái ngược với lập trình.

Hai câu hỏi: 1) Tôi có đang đi đúng hướng với xác suất chiến thắng và số lượt dự kiến ​​sẽ thắng không? 2) Nếu vậy, bạn có thể giúp tôi giải quyết những chuỗi vô tận này. Phải thừa nhận rằng, tôi không tuyệt vời với việc giải quyết loạt bài.

Chỉnh sửa: Câu hỏi đã được trả lời, nhưng tôi muốn đăng mã của mình trong trường hợp có ai quan tâm. (Ban đầu tôi đã nghĩ về vấn đề này trong điều kiện của một trận hải chiến, vì vậy đó là lý do tại sao các bình luận và tên biến được đặt tên theo cách đó).

from pylab import *
nSim = 100000
p_h1 = 0.5
p_h2 = 0.5
number_won = 0
total_shots = []
for i in range(nSim):
    won = False
    shots_fired = 0
    while not won:
        shots_fired += 1
        # simulate shot
        shot = rand(1)
        # if it hits, the game is over
        if shot <= p_h1:
            won = True
            number_won += 1
        # else, other player shoots
        else:
            shot = rand(1)
            if shot <= p_h2:
                won = True 
        total_shots.append(shots_fired)

print 'from monte carlo simulation:'
print 'P(win): ', float(number_won) / float(nSim)
print 'expected # of shots: ', np.array(total_shots).mean()

# testing
print 'from theory:'
denom = (1-p_h1)*(1-p_h2)
print 'P(win): ', p_h1 / (1 - denom)
pstar = (1 - (1-p_h1)*(1-p_h2))
print 'expected # of shots: ', 1. / pstar

và đầu ra:

from monte carlo simulation:
P(win):  0.66706
expected # of shots:  1.33967131236
from theory:
P(win):  0.666666666667
expected # of shots:  1.33333333333

Bởi "bạn sẽ mất bao nhiêu lượt để chiến thắng", bạn có cho rằng mình thắng không? Đây có phải là một xác suất có điều kiện?
Glen_b -Reinstate Monica

Tôi giả sử người chơi lật coin1 thắng. Điều kiện duy nhất có vẻ là player2 phải luôn lật đuôi để người chơi1 giành chiến thắng.
wsavran

Thuật ngữ lưu ý: chúng tôi không 'giải quyết' loạt. "Giải" là một cái gì đó chúng ta làm với các phương trình. Chúng ta có thể tính tổng các thuật ngữ (đánh giá chuỗi, tổng chuỗi các thuật ngữ). Mọi người thường nói "tổng hợp chuỗi" (có lẽ lỏng lẻo vì một chuỗi chính thức là tổng của các điều khoản - nhưng không mơ hồ).
Glen_b -Reinstate Monica

Cảm ơn @Glen_b, đó là một điểm hay về loạt bài "giải quyết". Nó không có ý nghĩa nhiều để nói rằng.
wsavran

Câu trả lời:


6

[Tôi đã đặt một số tài liệu về cách tính tổng tiến triển hình học và kỳ vọng của các biến ngẫu nhiên hình học ở cuối; câu trả lời này dựa trên kết quả như vậy nhưng chúng khá nổi tiếng nên tôi đoán tôi sẽ không bắt đầu với chúng. Nếu bất kỳ độc giả nào không, sau đó bỏ qua đến cuối để xem một cách để đưa họ ra. Thật đáng để tự mình thực hiện một số điều đó (không nhìn trộm) để bạn khắc phục ý tưởng trong đầu.]

Nếu bạn cho rằng người chơi 1 phải thắng thì bạn cần tính ra các xác suất có điều kiện. Khi bạn đặt điều kiện cho người chơi 1 chiến thắng, tính toán của bạn không chính xác.

P(Một|B)= =P(MộtB)P(B)

P(tại quăng k người chơi 1 thắng|người chơi 1 thắng)= =P(người chơi 1 thắng trên quăng k)P(người chơi 1 thắng)

= =p1(1-p1)k-1(1-p2)k-1Σj= =1p1(1-p1)j-1(1-p2)j-1

Bây giờ, hãy tiết kiệm cho mình một số nỗ lực: Hãy để1-p*= =(1-p1)(1-p2)

= =p1(1-p*)k-1p1Σj= =1(1-p*)j-1

= =p*(1-p*)k-1p*Σj= =1(1-p*)j-1

Bây giờ tử số là pmf của một biến ngẫu nhiên hình học và mẫu số là tổng của pmf hình học đó (tính tổng bằng 1):

= =p*(1-p*)k-1

(với một số suy nghĩ bạn có thể đi đến cùng một câu trả lời trực tiếp, mà không cần bất kỳ thao tác đại số nào)

Bây giờ kỳ vọng có điều kiện xuất hiện ngay lập tức

E(số lần ném cho đến khi người chơi 1 thắng|người chơi 1 thắng))= =1p*


Tóm tắt một loạt hình học:

S0= =p+p(1-p)+p(1-p)2+p(1-p)3+...

(1-p)S0= =p(1-p)+p(1-p)2+p(1-p)3+...

(1-(1-p))S0= =p+0+0+0+...

Vậy hoặc .pS0= =pS0= =1

Nếu bạn cần xem làm thế nào để có được kỳ vọng về biến ngẫu nhiên hình học ( ), chúng ta có thể sử dụng thủ thuật tương tự như trên - viết ra các thuật ngữ trong từng cái một, và sau đó viết ra các thuật ngữ trong , nhưng thay đổi để tất cả các thuật ngữ thứ hai được chuyển sang một bên phải.pS1= =Σk= =1kp(1-p)k-1(1-p)S1

Sau đó, sử dụng các thuật ngữ khác nhau theo thời hạn và lần này bạn còn lại một chuỗi hình học (thay vì một giá trị duy nhất và các điều khoản bị hủy hoàn toàn), nhưng chúng tôi đã biết cách tính tổng chuỗi hình học, chúng tôi đã thực hiện với ở trên.S0


Cảm ơn cho một câu trả lời thông tin. Lý thuyết kiểm tra với mô phỏng Monte Carlo. Tôi sẽ đăng mã của mình trong câu hỏi trong trường hợp có ai quan tâm.
wsavran

Tôi có thể xem xét lại điều này muộn, nhưng tôi đang làm việc thông qua đại số và không nên tổng hợp đến vô cùng trong Eq.2 và Eq.3? Tôi chỉ nhận được câu trả lời đúng khi tôi có tổng số vào tất cả các vòng có thể.
wsavran

Có, giới hạn trên của các khoản tiền chắc chắn phải là ở mọi nơi. Xin lỗi, đó là một lỗi đánh máy sau đó đã được sao chép xuống.
Glen_b -Reinstate Monica

2

Hãy để chúng tôi xác định một vòng ném là hai lần ném; lần ném đầu tiên của A, người tung đồng xu với và lần ném thứ hai bởi B, người ném đồng xu với .P(Thủ trưởng)= =p1P(Thủ trưởng)= =p2

Kết quả của một vòng và xác suất tương ứng là trong đó, nếu một trong hai kết quả đầu tiên xảy ra, A thắng (với xác suất ); trên thực tế, việc B ném một đồng xu hoàn toàn không thành vấn đề một khi A đã ném Đầu. Gọi sự kiện này Nếu kết quả thứ ba xảy ra, B thắng (với xác suất ; chúng tôi gọi đây là Nếu kết quả thứ tư xảy ra, không ai thắng và vòng mới được bắt đầu. Đây là sự kiện Do đó, một trong ba sự kiện (rời rạc)

HHp1p2HTp1(1-p2)TH(1-p1)p2TT(1-p1)(1-p2)
p1MộtTH(1-p1)p2= =p2-p1p2BTTCMột,B,C có thể xảy ra trên một vòng. Trò chơi kết thúc vào một vòng có xác suất và tiếp tục cho vòng tiếp theo với xác suất .p*= =p1+p2-p1p21-p*

A thắng trò chơi nếu kết quả của các vòng là bất kỳ chuỗi sự kiện rời rạc nào sau đây: Do đó, và tương tự,

MộtCMộtCCMộtCCCMộtCk-1Một
P(Một)= =p1+(1-p*)p1+(1-p*)2p1+= =p1p*
P(B)= =(1-p1)p2+(1-p*)(1-p1)p2+(1-p*)2(1-p1)p2+= =(1-p1)p2p*= =p*-p1p*= =1-P(Một).

Lưu ý rằng với điều kiện trò chơi kết thúc vào vòng đang xem xét, xác suất người chơi chiến thắng là Đây là giống như xác suất vô điều kiện của và

P(Một chiến thắng)= =p1p1+p2-p1p2= =p1p*,P(B thắng)= =p2-p1p2p1+p2-p1p2= =p*-p1p*.
MộtB

Gọi là số vòng cho đến khi trò chơi kết thúc. cũng biểu thị số lần người chiến thắng trong trò chơi tung đồng xu. Khi đó, là biến ngẫu nhiên hình họctham số . Tuy nhiên, chương trình đoạn trước đó lạnh trên xảy ra sự kiện , các điều kiện xác suất là giống như vô điều kiện xác suất, có nghĩa là, _for mỗi , sự kiện và sự kiệnX XX p*= =p1+p2-p1p2{X= =k}Mộtk,k= =1,2,3,Giáo dục{X= =k}Một là các sự kiện độc lập lẫn nhau. Trên thực tế, các biến ngẫu nhiên là độc lập với sự kiện . Bây giờ, giá trị mong đợi của là và giá trị kỳ vọng này là vô cùng thờ ơ với sự xuất hiện hoặc không xảy ra . Nói tóm lại, số lần ném dự kiến ​​khi A thắng trò chơi là XMộtX

E[X]= =1p*+2(1-p*)p*+3(1-p*)2p*+= =p*[1+2(1-p*)+3(1-p*)2+]= =p*1(1-(1-p*))2= =p*1(p*)2= =1p*= =1p1+p2-p1p2
Một1p* tương đương với số lần ném dự kiến ​​khi B thắng trò chơi.

Cảm ơn đã đặt ra cách tiếp cận thay thế cho vấn đề.
wsavran
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.