Phân phối cho xúc xắc đa diện khác nhau tất cả được cuộn cùng một lúc là gì?


15

Lấy 5 vật rắn Platonic từ một bộ xúc xắc Dungeon & Dragons. Chúng bao gồm một con xúc xắc 4 mặt, 6 mặt (thông thường), 8 mặt, 12 mặt và 20 mặt. Tất cả bắt đầu từ số 1 và đếm lên 1 trên tổng số của họ.

Cuộn tất cả chúng cùng một lúc, lấy tổng của chúng (tổng tối thiểu là 5, tối đa là 50). Làm như vậy nhiều lần. Phân phối là gì?

Rõ ràng họ sẽ có xu hướng về phía cấp thấp, vì có nhiều số thấp hơn cao hơn. Nhưng sẽ có những điểm uốn đáng chú ý ở mỗi ranh giới của cá nhân chết?

[Chỉnh sửa: Rõ ràng, những gì dường như không rõ ràng. Theo một trong những nhà bình luận, trung bình là (5 + 50) /2=27,5. Tôi đã không mong đợi điều này. Tôi vẫn muốn xem biểu đồ.] [Edit2: Sẽ có ý nghĩa hơn khi thấy rằng sự phân phối của n xúc xắc giống như mỗi con xúc xắc riêng biệt, được thêm vào với nhau.]


1
Ý của bạn là phân phối tổng của các đồng phục rời rạc ? [1,4]+[1,6]+[1,8]+[1,12]+[1,20]
gung - Phục hồi Monica

2
Một cách để kiểm tra nó là mô phỏng. Trong R : hist(rowSums(sapply(c(4, 6, 8, 12, 20), sample, 1e6, replace = TRUE))). Nó không thực sự có xu hướng về cấp thấp; trong số các giá trị có thể từ 5 đến 50, trung bình là 27,5 và phân phối (trực quan) không xa so với bình thường.
David Robinson

2
Bộ D & D của tôi có d10 cũng như 5 bạn đề cập (cộng với một bộ giải mã, mà tôi cho rằng bạn không bao gồm)
Glen_b -Reinstate Monica

1
Wolfram Alpha tính toán chính xác câu trả lời . Đây là hàm tạo xác suất , từ đó bạn có thể đọc phân phối trực tiếp. BTW, câu hỏi này là một trường hợp đặc biệt của một câu hỏi được hỏi và trả lời kỹ lưỡng tại stats.stackexchange.com/q/3614 và tại stats.stackexchange.com/questions/116792 .
whuber

2
@AlecTeal: Dễ đấy, anh chàng khó tính. Nếu bạn đã thực hiện nghiên cứu của mình, bạn sẽ thấy rằng tôi không có máy tính để tự chạy mô phỏng. Và lăn 100 lần, dường như không hiệu quả cho một câu hỏi đơn giản như vậy.
Marcos

Câu trả lời:


18

Tôi sẽ không muốn làm điều đó theo đại số, nhưng bạn có thể tính toán pmf đủ đơn giản (nó chỉ là tích chập, điều này thực sự dễ dàng trong một bảng tính).

Tôi đã tính những thứ này trong một bảng tính *:

i        n(i)   100 p(i)
5         1     0.0022
6         5     0.0109
7        15     0.0326
8        35     0.0760
9        69     0.1497
10      121     0.2626
11      194     0.4210
12      290     0.6293
13      409     0.8876
14      549     1.1914
15      707     1.5343
16      879     1.9076
17     1060     2.3003
18     1244     2.6997
19     1425     3.0924
20     1597     3.4657
21     1755     3.8086
22     1895     4.1124
23     2014     4.3707
24     2110     4.5790
25     2182     4.7352
26     2230     4.8394
27     2254     4.8915
28     2254     4.8915
29     2230     4.8394
30     2182     4.7352
31     2110     4.5790
32     2014     4.3707
33     1895     4.1124
34     1755     3.8086
35     1597     3.4657
36     1425     3.0924
37     1244     2.6997
38     1060     2.3003
39      879     1.9076
40      707     1.5343
41      549     1.1914
42      409     0.8876
43      290     0.6293
44      194     0.4210
45      121     0.2626
46       69     0.1497
47       35     0.0760
48       15     0.0326
49        5     0.0109
50        1     0.0022

Ở đây là số cách nhận được mỗi tổng i ; p ( i ) là xác suất, trong đó p (n(i)ip(i) . Các kết quả rất có thể xảy ra ít hơn 5% thời gian.p(i)=n(i)/46080

Trục y là xác suất được biểu thị bằng phần trăm. nhập mô tả hình ảnh ở đây

* Phương pháp tôi đã sử dụng tương tự như quy trình được nêu ở đây , mặc dù các cơ chế chính xác liên quan đến việc thiết lập thay đổi khi chi tiết giao diện người dùng thay đổi (bài viết đó đã được khoảng 5 năm mặc dù tôi đã cập nhật khoảng một năm trước). Và tôi đã sử dụng một gói khác lần này (lần này tôi đã thực hiện nó trong chương trình Calc của LibreOffice). Tuy nhiên, đó là ý chính của nó.


Thật ngạc nhiên, tôi không mong đợi một sự phân phối đối xứng nào cả. Tôi không chắc tại sao trực giác của tôi lại quá xa vời.
Marcos

6
Tổng các biến ngẫu nhiên đối xứng độc lập cũng đối xứng trong phân phối.
Glen_b -Reinstate Monica

Quy tắc tốt đẹp. Được xuất bản ở đâu đó?
Marcos

3
Vâng, nhưng quan điểm của tôi là quá tầm thường để có được một tạp chí để xuất bản nó, nó sẽ chỉ được coi là một bài tập cho một học sinh. Bạn có thể sử dụng thực tế là hàm đặc trưng của một biến ngẫu nhiên đối xứng quanh gốc tọa độ là có thật và thậm chí (thực tế bạn có thể tìm thấy nó được nêu ở trang wikipedia trên hàm đặc trưng ) - và tôi đoán bạn cần một biến -to-one thuộc tính của cfs so với pmfs, hoặc sử dụng mối quan hệ kép để xác định rằng một cf chẵn cũng ngụ ý một
pmf

2
... và thực tế là một sản phẩm của các hàm chẵn là chẵn, nhưng thực sự đủ rõ ràng chỉ từ việc xem xét trực tiếp cách thức tích chập hoạt động - trong một tổ hợp của hai hàm đối xứng (pmfs trong trường hợp này), cho mọi thuật ngữ trong tổng số các sản phẩm ở một đầu có một thuật ngữ tương ứng có cùng kích thước ở đầu kia, được đặt đối xứng quanh trung tâm.
Glen_b -Reinstate Monica

7

Vì vậy, tôi đã thực hiện mã này:

d4 <- 1:4  #the faces on a d4
d6 <- 1:6  #the faces on a d6
d8 <- 1:8  #the faces on a d8
d10 <- 1:10 #the faces on a d10 (not used)
d12 <- 1:12 #the faces on a d12
d20 <- 1:20 #the faces on a d20

N <- 2000000  #run it 2 million times
mysum <- numeric(length = N)

for (i in 1:N){
     mysum[i] <- sample(d4,1)+
                 sample(d6,1)+
                 sample(d8,1)+
                 sample(d12,1)+
                 sample(d20,1)
}

#make the plot
hist(mysum,breaks = 1000,freq = FALSE,ylim=c(0,1))
grid()

Kết quả là âm mưu này. nhập mô tả hình ảnh ở đây

Nó là khá Gaussian tìm kiếm. Tôi nghĩ rằng chúng ta (một lần nữa) có thể đã chứng minh một sự thay đổi về định lý giới hạn trung tâm.


2
Hmm, cuộn thấp nhất trong mô phỏng của bạn là 6. Xác suất lăn nó (hoặc bất kỳ cuộn đơn nào, giữ nguyên danh tính chết) là 1: 4 * 1: 6 * 1: 8 * 1: 10 * 1: 12 * 1: 20 = 1: 460800. Các thủ tục của tôi sẽ yêu cầu cỡ mẫu N ít nhất hai lần (có thể gấp 4 lần) số tiền này (như giới hạn Nyquist) để tiết lộ bất kỳ lỗi nào trong mô hình của tôi.
Marcos

Kinh nghiệm của tôi với Nyquist cũng cho biết tối thiểu gấp 4 lần. ... làm xong. Nếu 2 triệu không đủ, hãy cho tôi biết nó nên là gì.
EngrStudent - Phục hồi Monica

3
n

1
@EngrStudent: BTW, kết quả của bạn không xác nhận CLT?
Marcos

1
@theDoctor không, nó không xác nhận CLT vì một loạt lý do
Glen_b -Reinstate Monica

7

Một chút giúp đỡ cho trực giác của bạn:

Đầu tiên, hãy xem xét những gì xảy ra nếu bạn thêm một vào tất cả các khuôn mặt của một người chết, ví dụ như d4. Vì vậy, thay vì 1,2,3,4, các khuôn mặt hiện hiển thị 2,3,4,5.

So sánh tình huống này với bản gốc, dễ dàng nhận thấy rằng tổng số tiền hiện tại cao hơn một lần so với trước đây. Điều này có nghĩa là hình dạng của phân phối không thay đổi, nó chỉ được di chuyển một bước sang một bên.

Bây giờ trừ đi giá trị trung bình của mỗi con súc sắc từ mọi phía của con súc sắc đó.

Điều này mang lại cho súc sắc đánh dấu

  • 32121232
  • 523212123252
  • 7252321212325272

Vân vân.

Bây giờ, tổng của những con xúc xắc vẫn phải có hình dạng giống như ban đầu, chỉ được dịch chuyển xuống dưới. Cần phải rõ ràng rằng tổng này là đối xứng quanh không. Do đó phân bố ban đầu cũng đối xứng.


4

P(X= =Tôi)= =p(Tôi)
XTôi0,1,Giáo dục,n(0,1/6,1/6,1/6,1/6,1/6,1/6). Hàm tạo xác suất (pgf) sau đó được đưa ra bởip(t)= =Σ06p(Tôi)tTôi. Để con súc sắc thứ hai có phân phối được cho bởi vectơq(j) với j trong phạm vi 0,1,Giáo dục,m. Sau đó, sự phân phối của tổng số mắt trên hai cuộn xúc xắc độc lập được đưa ra bởi sản phẩm của pgf 's,p(t)q(t). Viết ra sản phẩm này chúng ta có thể thấy nó được đưa ra bởi tích chập của các chuỗi hệ số, do đó có thể được tìm thấy bởi hàm R chập (). Hãy kiểm tra điều này bằng hai lần ném xúc xắc tiêu chuẩn:
> p  <-  q  <-  c(0, rep(1/6,6))
> pq  <-  convolve(p,rev(q),type="open")
> zapsmall(pq)
 [1] 0.00000000 0.00000000 0.02777778 0.05555556 0.08333333 0.11111111
 [7] 0.13888889 0.16666667 0.13888889 0.11111111 0.08333333 0.05555556
[13] 0.02777778

và bạn có thể kiểm tra xem điều đó có đúng không (bằng cách tính toán bằng tay). Bây giờ cho câu hỏi thực sự, năm con xúc xắc với 4,6,8,12,20 bên. Tôi sẽ làm phép tính giả sử probs đồng phục cho mỗi con xúc xắc. Sau đó:

> p1  <-  c(0,rep(1/4,4))
> p2 <-  c(0,rep(1/6,6))
> p3 <-  c(0,rep(1/8,8))
> p4  <-  c(0, rep(1/12,12))
> p5  <-  c(0, rep(1/20,20))
> s2  <-  convolve(p1,rev(p2),type="open")
> s3 <-  convolve(s2,rev(p3),type="open")
> s4 <-  convolve(s3,rev(p4),type="open")
> s5 <- convolve(s4, rev(p5), type="open")
> sum(s5)
[1] 1
> zapsmall(s5)
 [1] 0.00000000 0.00000000 0.00000000 0.00000000 0.00000000 0.00002170
 [7] 0.00010851 0.00032552 0.00075955 0.00149740 0.00262587 0.00421007
[13] 0.00629340 0.00887587 0.01191406 0.01534288 0.01907552 0.02300347
[19] 0.02699653 0.03092448 0.03465712 0.03808594 0.04112413 0.04370660
[25] 0.04578993 0.04735243 0.04839410 0.04891493 0.04891493 0.04839410
[31] 0.04735243 0.04578993 0.04370660 0.04112413 0.03808594 0.03465712
[37] 0.03092448 0.02699653 0.02300347 0.01907552 0.01534288 0.01191406
[43] 0.00887587 0.00629340 0.00421007 0.00262587 0.00149740 0.00075955
[49] 0.00032552 0.00010851 0.00002170
> plot(0:50,zapsmall(s5))

Cốt truyện được hiển thị dưới đây:

enter image description here

Bây giờ bạn có thể so sánh giải pháp chính xác này với mô phỏng.


1

Các giới hạn trung tâm lý trả lời câu hỏi của bạn. Mặc dù các chi tiết và bằng chứng của nó (và bài viết trên Wikipedia) có phần uốn éo, nhưng ý chính của nó rất đơn giản. Theo Wikipedia, nó nói rằng

tổng của một số biến ngẫu nhiên độc lập và phân phối giống hệt nhau với phương sai hữu hạn sẽ có xu hướng phân phối bình thường khi số lượng biến tăng lên.

Phác thảo một bằng chứng cho trường hợp của bạn:

Khi bạn nói rằng cuộn cuộn xúc xắc cùng một lúc, thì mỗi cuộn xúc xắc là một biến ngẫu nhiên.

Xúc xắc của bạn có số hữu hạn được in trên chúng. Do đó, tổng các giá trị của chúng có phương sai hữu hạn.

Mỗi khi bạn tung tất cả xúc xắc, phân phối xác suất của kết quả là như nhau. (Xúc xắc không thay đổi giữa các cuộn.)

Nếu bạn lắc xí ngầu một cách công bằng, thì mỗi lần bạn cuộn chúng, kết quả sẽ độc lập. (Các cuộn trước không ảnh hưởng đến các cuộn trong tương lai.)

Độc lập? Kiểm tra. Phân phối giống hệt nhau? Kiểm tra. Phương sai hữu hạn? Kiểm tra. Do đó, tổng có xu hướng về một phân phối bình thường.

Thậm chí sẽ không có vấn đề gì nếu sự phân phối cho một cuộn của tất cả các con xúc xắc bị lệch về phía cấp thấp. Tôi sẽ không quan trọng nếu có cusps trong phân phối đó. Tất cả các tổng kết làm mịn nó ra và làm cho nó một gaussian đối xứng. Bạn thậm chí không cần phải làm bất kỳ đại số hoặc mô phỏng để hiển thị nó! Đó là cái nhìn sâu sắc đáng ngạc nhiên của CLT.


3
Mặc dù CLT có liên quan và như các bài đăng khác hiển thị, các bản phân phối trông có vẻ gaussian, chúng tôi chỉ xử lý tổng cộng 5 bản phân phối không giống nhau độc lập . Vì vậy, điểm 1) 5 không thực sự đủ lớn để gọi một định lý áp dụng "ở vô cực". Điểm 2) bạn không thể sử dụng CLt vanilla, vì những thứ bạn tính không phải là iid. Bạn cần Lyapunov CLT, tôi nghĩ vậy.
Peter

2
Bạn không cần Định lý giới hạn trung tâm để nói rằng tổng của một số biến ngẫu nhiên độc lập có phân phối đối xứng về các trung tâm tương ứng của chúng có phân phối đối xứng về tổng của các trung tâm.
Henry

@Peter: Bạn đang thiếu cấu trúc bằng chứng của tôi. OP nói “cuộn chúng cùng một lúc.” Tôi lấy từng cuộn tất cả các con xúc xắc là một biến ngẫu nhiên. Những biến ngẫu nhiên này có một phân phối giống hệt nhau. Không cần Lyapunov. Ngoài ra, OP cho biết, Google làm như vậy nhiều lần, mà tôi nghĩ là có nghĩa là trong giới hạn, vì vậy điểm số 1 của bạn không hợp lệ. Chúng tôi không chỉ tổng hợp một cuộn 5 con xúc xắc ở đây.
Paul Cantrell

2
@PaulCantrell Each roll of all the dice is the sum of five independent non-identically distributed variables. The OP is asking about the distribution of that sum. You may do many rolls of the 5 dice, but that's just sampling from the distribution under question, nobody is summing those samples.
Peter

1
@PaulCantrell I guess it depends on how you interpret "Do so multiple times." Do so multiple times, and them sum again (getting a single value), or do so multiple times and look at the histogram of those samples (getting multiple values). I took the latter interpretation.
Peter
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.