Cuộn một chết 6 mặt cho đến khi tổng số


11

Đây là câu hỏi:

Bạn lặp một con xúc xắc 6 mặt công bằng lặp đi lặp lại cho đến khi tổng số con xúc xắc lớn hơn hoặc bằng M. Độ lệch trung bình và độ lệch chuẩn của tổng trừ M khi M = 300 là bao nhiêu?

Tôi có nên viết một mã để trả lời các loại câu hỏi này không?

Xin vui lòng cho tôi một số gợi ý về điều đó. cảm ơn!


1
Vui lòng thêm [self-study]thẻ và đọc wiki của nó . Sau đó cho chúng tôi biết những gì bạn hiểu cho đến nay, những gì bạn đã cố gắng và nơi bạn bị mắc kẹt. Chúng tôi sẽ cung cấp gợi ý để giúp bạn có được unstuck.
gung - Phục hồi Monica

2
Tôi nghi ngờ rằng M=300 có thể được đọc là " rất lớn M" vì tôi tin rằng M=301 hoặc M=999 sẽ cho kết quả gần như chính xác. Những gì tôi sẽ làm là tìm sự phân bố của tổng trừ M .
Henry

Câu trả lời:


13

Bạn chắc chắn có thể sử dụng mã, nhưng tôi sẽ không mô phỏng.

Tôi sẽ bỏ qua phần "trừ M" (cuối cùng bạn có thể làm điều đó đủ dễ dàng).

Bạn có thể tính toán xác suất đệ quy rất dễ dàng, nhưng câu trả lời thực tế (với độ chính xác rất cao) có thể được tính từ lý luận đơn giản.

Đặt các cuộn là . Đặt S t = t i = 1 X i .X1,X2,...St=i=1tXi

Hãy là chỉ số nhỏ nhất mà S τM .τSτM

P(Sτ=M)=P(got to M6 at τ1 and rolled a 6)+P(got to M5 at τ1 and rolled a 5)++P(got to M1 at τ1 and rolled a 1)=16j=16P(Sτ1=Mj)

nhập mô tả hình ảnh ở đây

tương tự

P(Sτ=M+1)=16j=15P(Sτ1=Mj)

P(Sτ=M+2)=16j=14P(Sτ1=Mj)

P(Sτ=M+3)=16j=13P(Sτ1=Mj)

P(Sτ=M+4)=16j=12P(Sτ1=Mj)

P(Sτ=M+5)=16P(Sτ1=M1)

Các phương trình tương tự như phương trình đầu tiên ở trên có thể (ít nhất là về nguyên tắc) được chạy lại cho đến khi bạn đạt được bất kỳ điều kiện ban đầu nào để có được mối quan hệ đại số giữa các điều kiện ban đầu và xác suất mà chúng ta muốn (sẽ rất tẻ nhạt và không đặc biệt là giác ngộ) hoặc bạn có thể xây dựng các phương trình chuyển tiếp tương ứng và chạy chúng về phía trước từ các điều kiện ban đầu, rất dễ thực hiện bằng số (và đó là cách tôi kiểm tra câu trả lời của mình). Tuy nhiên, chúng ta có thể tránh tất cả điều đó.

Xác suất của các điểm đang chạy trung bình có trọng số của các xác suất trước đó; những điều này sẽ (nhanh chóng về mặt hình học) làm trơn tru mọi biến thể xác suất từ ​​phân phối ban đầu (tất cả xác suất tại điểm 0 trong trường hợp có vấn đề của chúng tôi). Các

Để tính gần đúng (rất chính xác), chúng ta có thể nói rằng đến M - 1 nên có khả năng gần như bằng nhau tại thời điểm τ - 1 (thực sự gần với nó), và vì vậy từ trên chúng ta có thể viết ra rằng xác suất sẽ rất gần với tỷ lệ đơn giản, và vì chúng phải được chuẩn hóa, chúng ta chỉ cần viết ra xác suất.M6M1τ1

Có thể nói, chúng ta có thể thấy rằng nếu xác suất bắt đầu từ đến M - 1 hoàn toàn bằng nhau, thì có 6 cách có khả năng như nhau để đến M , 5 khi đến M + 1 , v.v. 1 cách để đến M + 5 .M6M1MM+1M+5

Đó là, xác suất nằm trong tỷ lệ 6: 5: 4: 3: 2: 1 và tổng bằng 1, vì vậy chúng không quan trọng để viết ra.

Việc tính toán chính xác (tối đa các lỗi làm tròn số tích lũy) bằng cách chạy xác suất chuyển tiếp từ 0 (tôi đã thực hiện trong R) đưa ra sự khác biệt về thứ tự .Machine$double.eps( trên máy của tôi) từ phép tính gần đúng ở trên (đơn giản là, đơn giản lý luận dọc theo các dòng trên cho câu trả lời chính xác một cách hiệu quả , vì chúng gần với câu trả lời được tính toán từ đệ quy như chúng ta mong đợi câu trả lời chính xác nên có).2.22e-16

Đây là mã của tôi cho điều đó (hầu hết chỉ là khởi tạo các biến, công việc là tất cả trong một dòng). Mã bắt đầu sau cuộn đầu tiên (để lưu tôi đặt vào ô 0, đây là một phiền toái nhỏ phải giải quyết trong R); ở mỗi bước, nó sẽ lấy ô thấp nhất có thể bị chiếm giữ và di chuyển về phía trước bằng một cuộn chết (trải rộng xác suất của ô đó qua 6 ô tiếp theo):

 p = array(data = 0, dim = 305)
 d6 = rep(1/6,6)
 i6 = 1:6
 p[i6] = d6
 for (i in 1:299) p[i+i6] = p[i+i6] + p[i]*d6

(chúng ta có thể sử dụng rollapply(từ zoo) để thực hiện việc này hiệu quả hơn - hoặc một số chức năng khác như vậy - nhưng sẽ dễ dịch hơn nếu tôi giữ nó rõ ràng)

Lưu ý rằng đó d6là hàm xác suất rời rạc từ 1 đến 6, do đó mã bên trong vòng lặp ở dòng cuối cùng đang xây dựng các đường trung bình có trọng số của các giá trị trước đó. Chính mối quan hệ này làm cho các xác suất trở nên suôn sẻ (cho đến vài giá trị cuối cùng mà chúng tôi quan tâm).

Vì vậy, đây là 50 giá trị lẻ đầu tiên (25 giá trị đầu tiên được đánh dấu bằng các vòng tròn). Ở mỗi , giá trị trên trục y biểu thị xác suất tích lũy trong ô cuối cùng trước khi chúng tôi đưa nó về phía trước trong 6 ô tiếp theo.t

nhập mô tả hình ảnh ở đây

Khi bạn thấy nó trơn tru (đến , tỷ lệ nghịch của giá trị trung bình của số bước mà mỗi lần lăn sẽ đưa bạn) khá nhanh và không đổi.1/μ

Và một khi chúng ta đạt , các xác suất đó sẽ giảm đi (vì chúng ta sẽ không đặt xác suất cho các giá trị tại M và vượt ra ngoài lần lượt)MM

nhập mô tả hình ảnh ở đây

Vì vậy, ý tưởng rằng các giá trị tại đến M - 6 nên có khả năng như nhau bởi vì các dao động từ các điều kiện ban đầu sẽ được làm mịn rõ ràng là trường hợp rõ ràng.M1M6

Vì lý do không phụ thuộc vào bất cứ điều gì ngoại trừ đủ lớn để các điều kiện ban đầu biến mất để M - 1 đến M - 6 có thể xảy ra gần như bằng nhau tại thời điểm τ - 1 , phân phối về cơ bản sẽ giống nhau cho mọi lớn M , như Henry đề nghị trong các ý kiến.MM1M6τ1M

Nhìn lại, gợi ý của Henry (cũng nằm trong câu hỏi của bạn) để làm việc với tổng trừ M sẽ tiết kiệm được một chút nỗ lực, nhưng đối số sẽ theo các dòng rất giống nhau. Bạn có thể tiến hành bằng cách cho và viết các phương trình tương tự liên quan đến R 0 đến các giá trị trước, v.v.Rt=StMR0

Từ phân phối xác suất, giá trị trung bình và phương sai của xác suất là đơn giản.

Chỉnh sửa: Tôi cho rằng tôi nên đưa ra giá trị trung bình tiệm cận và độ lệch chuẩn của vị trí cuối cùng trừ :M

Sự dư thừa có nghĩa là tiệm cận là và độ lệch chuẩn là253 . VớiM=300,điều này chính xác ở mức độ lớn hơn nhiều so với khả năng bạn quan tâm.253M=300


+1 Tôi không hoàn toàn hiểu câu trả lời này cho đến khi tôi tự phát triển, điều này dường như không cần thiết. Có thể một số độc giả sẽ thấy giá trị trong kết quả minh họa và mô phỏng, vì vậy tôi sẽ giữ câu trả lời của mình mở.
whuber

1
@whuber Câu trả lời của tôi ít cụ thể hơn tôi mong muốn vì tôi đã hoạt động theo giả định rằng đây là bài tập về nhà (vì vậy tôi đã tránh làm quá nhiều công cụ phái sinh hoặc đưa ra bất kỳ mã nào - nó được dự định là một phác thảo). Tôi thấy thật khó để viết một câu trả lời rõ ràng về vấn đề này (đó là một trong đó sự cụ thể giúp nhiều hơn bình thường). Vì bạn đã đưa ra câu trả lời có chứa số và mã thực tế (câu trả lời tôi chắc chắn nên ở lại) Tôi cảm thấy mình có thể làm một số điều hy vọng sẽ giúp câu trả lời của tôi dễ hiểu hơn (rõ ràng hơn, đưa ra mã của riêng tôi) .
Glen_b -Reinstate Monica

Tôi đã viết một lời giải thích tốt hơn nhiều về loại vấn đề này ở đâu đó vài năm trước. Nếu tôi có thể nhớ / tìm hiểu làm thế nào tôi đã đi, tôi sẽ cố gắng đưa một số của nó ở đây.
Glen_b -Reinstate Monica

@Glen_b hiểu các phương trình một chút. Tôi là người mới Làm thế nào để bắt đầu suy nghĩ như thế này? Có cuốn sách nào bạn có thể giới thiệu cho mục đích này không? Câu trả lời của bạn sẽ rất hữu ích.
Nghi ngờ thông thường

Nghi ngờ thông thường - Tôi đã viết các phương trình bằng cách tưởng tượng một bảng trò chơi như một bản nhạc dài và đi "cách nào tôi có thể đến không gian này theo cách phù hợp với các điều kiện trong vấn đề, và với cơ hội nào?"; Tôi đã làm nó cho một không gian có nhãn "M", sau đó cho không gian sau nó, v.v. Tôi đã viết phép tính tương tự về phía trước cho mã bằng cách tưởng tượng ở gần ô bắt đầu và nói "nếu tôi ở đây, tôi sẽ là người tiếp theo, với cơ hội nào?". Các phương trình tất cả chỉ là câu trả lời cho những câu hỏi.
Glen_b -Reinstate Monica

8

Ω0nEnn

En= ={ωΩ|nω}.

XM(ω)ωMXM-MXM

XM(ω)-M{0,1,2,3,4,5}XM-M= =kωp(Tôi)= =1/6TôiTôi= =1,2,3,4,5,6

Pr(XM-M= =k)= =Σj= =k6Pr(EM+k-j)p(j)= =16Σj= =k6Pr(EM+k-j).

M

Pr(ETôi)2/7.
(1+2+3+4+5+6)/6= =7/2ω

ETôiETôi-11ETôi-22ETôi-66

Pr(ETôi)= =Σj= =16Pr(ETôi-j)p(j)= =16Σj= =16Pr(ETôi-j).

Các giá trị ban đầu của chuỗi này là

Pr(E0)= =1;Pr(E-Tôi)= =0,Tôi= =1,2,3,Giáo dục.

Hình: cốt truyện của E_i

Pr(ETôi)Tôi2/7

Pr(ETôi)Tôithứ tự

x6-p(1)x5-p(2)x4-p(3)x3-p(6)= =x6-(x5+x4+x3+x2+x+1)/6.

điểm kinh nghiệm(-0.314368)điểm kinh nghiệm(-36,05)Tôi»-36,05/-0.314368= =1152/7

M= =300»115EM+k-j= =2/7

Pr(XM-M= =(0,1,2,3,4,5))= =(27)(16)(6,5,4,3,2,1).

Việc tính toán giá trị trung bình và phương sai của phân phối này rất đơn giản và dễ dàng.


RM+5= =304X300-300χ20.1367

M <- 300
n.iter <- 1e5
set.seed(17)
n <- ceiling((2/7) * (M + 3*sqrt(M)))
dice <- matrix(ceiling(6*runif(n*n.iter)), n, n.iter)
omega <- apply(dice, 2, cumsum)
omega <- omega[, apply(omega, 2, max) >= M+5]
omega[omega < M] <- NA
x <- apply(omega, 2, min, na.rm=TRUE)
count <- tabulate(x)[0:5+M]
(cbind(count, expected=round((2/7) * (6:1)/6 * length(x), 1)))
chisq.test(count, p=(2/7) * (6:1)/6)
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.