Khái niệm thống kê để giải thích lý do tại sao bạn ít có khả năng lật cùng số đầu như đuôi, khi số lần lật tăng?


28

Tôi đang nghiên cứu xác suất và thống kê bằng cách đọc một vài cuốn sách và viết một số mã, và trong khi mô phỏng các đồng xu lật, tôi nhận thấy một cái gì đó khiến tôi hơi phản cảm với trực giác ngây thơ của một người. Nếu bạn lật một đồng xu công bằng n lần, tỷ lệ đầu và đuôi sẽ hội tụ về 1 khi n tăng, chính xác như bạn mong đợi. Nhưng mặt khác, khi n tăng lên, có vẻ như bạn trở nên ít có khả năng lật chính xác số lượng đầu như đuôi, do đó có được tỷ lệ chính xác là 1.

Ví dụ: (một số đầu ra từ chương trình của tôi)

For 100 flips, it took 27 experiments until we got an exact match (50 HEADS, 50 TAILS)
For 500 flips, it took 27 experiments until we got an exact match (250 HEADS, 250 TAILS)
For 1000 flips, it took 11 experiments until we got an exact match (500 HEADS, 500 TAILS)
For 5000 flips, it took 31 experiments until we got an exact match (2500 HEADS, 2500 TAILS)
For 10000 flips, it took 38 experiments until we got an exact match (5000 HEADS, 5000 TAILS)
For 20000 flips, it took 69 experiments until we got an exact match (10000 HEADS, 10000 TAILS)
For 80000 flips, it took 5 experiments until we got an exact match (40000 HEADS, 40000 TAILS)
For 100000 flips, it took 86 experiments until we got an exact match (50000 HEADS, 50000 TAILS)
For 200000 flips, it took 96 experiments until we got an exact match (100000 HEADS, 100000 TAILS)
For 500000 flips, it took 637 experiments until we got an exact match (250000 HEADS, 250000 TAILS)
For 1000000 flips, it took 3009 experiments until we got an exact match (500000 HEADS, 500000 TAILS)

Câu hỏi của tôi là: có một khái niệm / nguyên tắc trong thống kê / lý thuyết xác suất giải thích điều này? Nếu vậy, nguyên tắc / khái niệm là gì?

Liên kết đến mã nếu bất cứ ai quan tâm đến cách tôi tạo ra cái này.

-- chỉnh sửa --

Đối với những gì nó có giá trị, đây là cách tôi đã giải thích điều này với bản thân mình trước đó. Nếu bạn lật một đồng xu công bằng n lần và đếm số lượng đầu, về cơ bản bạn đang tạo ra một số ngẫu nhiên. Tương tự như vậy nếu bạn làm điều tương tự và đếm số đuôi, bạn cũng đang tạo một số ngẫu nhiên. Vì vậy, nếu bạn đếm cả hai, bạn thực sự tạo ra hai số ngẫu nhiên và khi n lớn hơn, các số ngẫu nhiên sẽ ngày càng lớn hơn. Và số lượng ngẫu nhiên bạn tạo ra càng lớn, càng có nhiều cơ hội để họ "bỏ lỡ" lẫn nhau. Điều làm cho điều này thú vị là hai số thực sự được liên kết theo một nghĩa, với tỷ lệ của chúng hội tụ về một khi chúng lớn hơn, mặc dù mỗi số là ngẫu nhiên trong sự cô lập. Có lẽ đó chỉ là tôi, nhưng tôi thấy đó là sự gọn gàng.


Bạn có tìm kiếm giải thích trực quan hoặc toán học?
Glen_b -Reinstate Monica

1
Cả hai, thực sự. Tôi nghĩ rằng tôi sắp xếp lý do theo nghĩa trực quan, nhưng tôi muốn hiểu lý do chính thức đằng sau nó.
trí

1
Bạn có biết cách tính xác suất nhị thức và áp dụng chúng cho tình huống này không? Nếu không, hãy tìm nó và tính toán.
Mark L. Stone

Wow, có nhiều câu trả lời hay cho câu hỏi này. Tôi cảm thấy tồi tệ khi phải chấp nhận cái này chứ không phải cái kia. Hãy để tôi nói rằng tôi đánh giá cao tất cả các câu trả lời và tất cả những người đã dành thời gian để chia sẻ những hiểu biết của họ về điều này.
trí

Câu trả lời:


31

Lưu ý rằng trường hợp số lượng đầu và số lượng đuôi bằng nhau giống như "chính xác một nửa thời gian bạn nhận được đầu". Vì vậy, hãy tập trung vào việc đếm số lượng đầu để xem liệu đó có phải là một nửa số lần tung hoặc so sánh tương đương tỷ lệ của các đầu với 0,5.

Bạn càng lật, số lượng đầu có thể có của bạn càng lớn - phân phối càng lan rộng ra (ví dụ: khoảng thời gian cho số đầu chứa 95% xác suất sẽ tăng lên khi số lần tung tăng lên) , do đó xác suất chính xác của một nửa đầu sẽ có xu hướng đi xuống khi chúng ta ném nhiều hơn.

Tương ứng, tỷ lệ người đứng đầu sẽ có nhiều giá trị có thể hơn; xem ở đây, nơi chúng tôi di chuyển từ 100 lần ném đến 200 lần ném:

enter image description here

Với 100 lần tung, chúng ta có thể quan sát tỷ lệ 0,49 đầu hoặc 0,5 đầu hoặc 0,51 đầu (v.v. - nhưng không có gì ở giữa các giá trị đó), nhưng với 200 lần ném, chúng ta có thể quan sát 0,49 hoặc 0,495 hoặc 0,50 hoặc 0,505 hoặc 0,510 - xác suất có nhiều giá trị hơn để "bao phủ" và do đó, mỗi cái sẽ có xu hướng nhận được một phần nhỏ hơn.

Hãy xem xét hơn bạn có tung với một số xác suất p i nhận được đầu i (chúng tôi biết các xác suất này nhưng nó không quan trọng đối với phần này) và bạn thêm hai lần ném nữa. Trong 2 n tung, n đứng đầu là khả năng kết quả nhất ( p n > p n ± 1 và nó đi xuống từ đó).2npii2nnpn>pn±1

Cơ hội có đầu trong 2 n + 2 lần ném là bao nhiêu?n+12n+2

(Dán nhãn các xác suất này với để chúng tôi không nhầm lẫn chúng với các xác suất trước đó, cũng để P (HH) là xác suất của "Đầu, Đầu" trong hai lần ném tiếp theo, v.v.)q

qn+1=pn1P(HH)+pn(P(HT)+P(TH))+pn+1P(TT)

<pnP(HH)+pn(P(HT)+P(TH))+pnP(TT)=pn

tức là nếu bạn thêm hai lần tung đồng xu nữa, xác suất của giá trị trung bình tự nhiên giảm xuống vì nó trung bình giá trị (giữa) có khả năng cao nhất với trung bình của các giá trị nhỏ hơn ở hai bên)

Vì vậy, miễn là bạn cảm thấy thoải mái mà đỉnh cao sẽ được ở giữa (đối với ), Xác suất của người đứng đầu chính xác một nửa phải giảm như n đi lên.2n=2,4,6,...n


Trong thực tế, chúng ta có thể chỉ ra rằng đối với lớn , p n giảm tỷ lệ với 1npn (không có gì đáng ngạc nhiên, vì sự phân bố số lượng đầu được chuẩn hóa tiếp cận với tính quy tắc và phương sai của tỷ lệ các đầu giảm theon).1nn


Theo yêu cầu, đây là mã R tạo ra thứ gì đó gần với âm mưu trên:

 x1 = 25:75
 x2 = 50:150
 plot(x1 / 100, dbinom(x1, 100, 0.5), type = "h",
       main = "Proportion of heads in 100 and 200 tosses",
       xlab = "Proportion of heads",
       ylab = "probability")
 points(x2 / 200, dbinom(x2, 200, 0.5), type = "h", col = 3)

1
Tôi đồng tình với @RustyStatistician ở trên liên quan đến 1000 từ trong đồ họa của bạn. Tín dụng thêm cho con trỏ để mã.
TomRoche

Con số tuyệt vời và lời giải thích!

@Tom Tôi đã bao gồm mã thực hiện mọi thứ trừ việc tạo "200" trong tiêu đề màu xanh lá cây.
Glen_b -Reinstate Monica

1
@Glen_b Cảm ơn bạn vì một bài viết tuyệt vời khác và sự hào phóng của việc chia sẻ các dòng mã. Cốt truyện đẹp! Thật khó để thừa nhận điều đó, nhưng tôi gặp vấn đề với biểu thức toán học của khái niệm trong bài viết của bạn và đặc biệt là việc sử dụng chữ . P
Antoni Parellada

1
@Antoni chỉ có nghĩa là "xác suất nhận được 'Đầu, Đầu' trên hai lần ném bổ sung". Để có được n + 1 đầu trong 2n + 2 lần ném, bằng 2n lần ném, bạn phải có đầu n-1 (và sau đó ném 2 đầu) hoặc n đầu (và sau đó ném 1 đầu) hoặc ném 1 đầu (sau đó ném 0 đầu). P(HH)
Glen_b -Reinstate Monica

19

Chúng tôi biết rằng Luật số lớn là điều đảm bảo cho kết luận đầu tiên về thử nghiệm của bạn, cụ thể là, nếu bạn lật một đồng xu công bằng lần, tỷ lệ đầu trên đuôi sẽ hội tụ về 1 khi n tăng. nn

Vì vậy, không có vấn đề ở đó. Tuy nhiên, đó là về tất cả Luật số lớn cho chúng ta biết trong kịch bản này.

Nhưng bây giờ, hãy nghĩ về vấn đề này bằng trực giác hơn. Hãy suy nghĩ về việc lật một đồng xu một số lần nhỏ, ví dụ: .n=2,4,8,10

Khi bạn lật một đồng xu hai lần, tức là , hãy nghĩ đến các kịch bản có thể xảy ra của hai lần lật. (Ở đây H sẽ biểu thị đầu và T sẽ biểu thị đuôi). Trên lật nắm tay bạn có thể đã nhận được H và trên lật thứ hai bạn có thể đã nhận được T . Nhưng đó chỉ là một cách mà hai cú lật có thể xuất hiện. Bạn cũng có thể đã nhận được lần lật T đầu tiên và lần lật thứ hai H , và tất cả các kết hợp có thể khác. Vì vậy, vào cuối ngày, khi bạn lật 2 đồng xu, các kết hợp có thể bạn có thể thấy trên hai lần lật là S = { H H , H T ,n=2HTHTTH và do đó, có 4 kịch bản có thể xảy ra để lật n = 2 xu.

S={HH,HT,TH,TT}
n=2

Nếu bạn đã lật 4 đồng xu thì số kết hợp có thể bạn có thể thấy là và do đó, có 16 kịch bản có thể xảy ra để lật n = 4 xu.

S={HHHH,HHHT,HHTH,HTHH,THHH,HHTT,HTTH,TTHH,THHT,THTH,HTHT,HTTT,THTT,TTHT,TTTH,TTTT}
n=4

Lật xu dẫn đến 256 kết hợp.n=8

Lật xu dẫn đến 1.024 kết hợp.n=10

Và đặc biệt, việc lật bất kỳ số xu nào cũng dẫn đến 2 n kết hợp có thể.n2n

Bây giờ, chúng ta hãy thử và tiếp cận quan điểm xác suất vấn đề này. Nhìn lại trường hợp khi , chúng ta biết rằng xác suất nhận được chính xác cùng số lượng Đầu và Đuôi (nghĩa là khi bạn đặt tỷ lệ chính xác là 1) là P r ( Tỷ lệ chính xác là 1 ) = 2n=2 Khin=4, chúng ta biết rằng xác suất nhận được chính xác cùng số lượng Đầu và Đuôi là Pr(Tỷ lệ chính xác là 1)=6

Pr(Ratio of exactly 1)=24=0.5
n=4
Pr(Ratio of exactly 1)=616=0.375

Và nói chung, khi có xu hướng phát triển lớn hơn, chúng ta có xác suất nhận được chính xác cùng số lượng Đầu và Đuôi là 0.n

Nói cách khác, khi , ta có P r ( Tỷ lệ chính xác 1 ) 0n

Pr(Ratio of exactly 1)0

Và vì vậy, để trả lời câu hỏi của bạn. Thực sự những gì bạn đang quan sát chỉ là hệ quả của thực tế là sẽ có nhiều tổ hợp lật đồng xu hơn trong đó số lượng đầu và đuôi không bằng so với số lượng kết hợp mà chúng bằng nhau.



Như @Mark L. Stone gợi ý, nếu bạn cảm thấy thoải mái với công thức nhị thức và biến ngẫu nhiên nhị thức, thì bạn có thể sử dụng điều đó để hiển thị cùng một đối số.

Gọi là số lượng đầu được ghi khi lật một đồng xu công bằng n lần. chúng ta có thể coi X là một biến ngẫu nhiên đến từ phân phối nhị thức, nghĩa làXnXXBin(n,p=0.5)p=0.5

Pr(Ratio of exactly 1)=Pr(X=n2)=(nn/2)0.5n/2(0.5)nn/2=(nn/2)0.5n

n(nn/2)0.5n0n


2
0.5n0n(nn/2)0.5n0n!0.5n0
Cá bạc

@Glen_b Tôi không có đủ điểm để nhận xét về bài đăng của bạn, nhưng đồ họa tuyệt vời!

Cảm ơn @RustyStatistician, điều đó giúp ích rất nhiều. Phần đầu tiên trong lời giải thích của bạn khá giống với cách tôi nghĩ về nó, nhưng tôi không đủ xa cùng với các số liệu thống kê của tôi để biết cách xử lý nó bằng cách sử dụng phân phối Binomial. Về cơ bản, tôi đã đọc qua cuốn sách của mình một lần, không tìm ra vấn đề hay bất cứ điều gì, và bây giờ tôi sẽ quay lại từ đầu và viết mã để khám phá các khía cạnh khác nhau của tài liệu.
trí

@mindcrime nghe hay đấy! Rất vui vì tôi có thể giúp.

5

Xem Tam giác của Pascal .

Khả năng kết quả lật xu được thể hiện bằng các con số dọc theo hàng dưới cùng. Kết quả của đầu và đuôi bằng nhau là số giữa. Khi cây phát triển lớn hơn (tức là nhiều lần lật hơn), số ở giữa trở thành tỷ lệ nhỏ hơn của tổng của hàng dưới cùng.


1

Có lẽ nó giúp phác thảo rằng điều này có liên quan đến luật arcsine. Nó nói rằng đối với một đường dẫn kết quả, xác suất rằng đường dẫn đó tồn tại trong hầu hết thời gian trong miền tích cực hoặc tiêu cực cao hơn nhiều so với mức tăng và giảm so với bạn mong đợi từ trực giác . Đây là một số liên kết:

http://www.math.unl.edu/~sdunbar1/ProbabilityTheory/Lessons/BernoulliTrials/ExcessHead/excessheads.shtml

https://en.wikipedia.org/wiki/Arcsine_law


1

Trong khi tỷ lệ đầu và đuôi hội tụ đến 1, phạm vi số có thể trở nên rộng hơn. (Tôi đang thực hiện các con số). Nói cho 100 lần ném, xác suất là 90% mà bạn có từ 45% đến 55% đầu. Đó là 90% mà bạn nhận được 45 đến 55 đầu. 11 khả năng cho số lượng người đứng đầu. Khoảng 9% khoảng bạn nhận được số lượng đầu và đuôi bằng nhau.

Nói cho 10.000 lần ném, xác suất là 95% mà bạn nhận được từ 49% đến 51% đầu. Vì vậy, tỷ lệ đã đến rất gần với 1. Nhưng bây giờ bạn có từ 4.900 đến 5.100 đầu. 201 khả năng. Cơ hội có số lượng bằng nhau chỉ khoảng 0,5%.

Và với một triệu lần ném, bạn khá chắc chắn có từ 49,9% đến 50,1% đầu. Đó là một phạm vi từ 499.000 đến 501.000 đầu. 2.001 khả năng. Cơ hội bây giờ giảm xuống 0,05%.

Ok, toán học đã được tạo thành. Nhưng điều này sẽ cho bạn một ý tưởng về "tại sao". Mặc dù tỷ lệ này tiến gần đến 1, số lượng khả năng trở nên lớn hơn, do đó, việc đánh chính xác nửa đầu, nửa đuôi, sẽ ngày càng ít xảy ra.

Một hiệu ứng thực tế khác: Không có khả năng trong thực tế là bạn có một đồng xu trong đó xác suất ném đầu là chính xác 50%. Nó có thể là 49,99371% nếu bạn có một đồng tiền thực sự tốt. Đối với số lần ném nhỏ, điều này không tạo ra sự khác biệt. Đối với số lượng lớn, tỷ lệ phần trăm của đầu sẽ hội tụ đến 49,99371% chứ không phải 50%. Nếu số lần ném đủ lớn, việc ném 50% trở lên sẽ trở nên rất, rất khó xảy ra.


0

Chà, một điều cần lưu ý là với số lần lật chẵn (nếu không thì xác suất lật đầu và đuôi bằng nhau dĩ nhiên là bằng 0), kết quả có thể xảy ra nhất sẽ luôn là kết quả có nhiều đầu lật như đuôi lật.

n

(1+x2)n.
n
pn=2n(nn/2).

n!

p1πn/2
n/2n2n

2
Câu trả lời của bạn có thể được cải thiện bằng cách xác định cẩn thận số lượng trong biểu thức của bạn. Những gì làn? Những gì làp?
Sycorax nói Phục hồi lại

0

Giả sử bạn lật một đồng xu hai lần. Có bốn kết quả có thể xảy ra: HH, HT, TH và TT. Trong hai trong số này, bạn có số lượng đầu và đuôi bằng nhau, do đó, có 50% khả năng bạn có cùng số lượng đầu và đuôi.

Bây giờ, giả sử bạn lật một đồng xu 4,305,492,102 lần. Bạn có mong đợi một cơ hội 50 phần trăm mà bạn sẽ kết thúc với chính xác 2.153.246.051 đầu và 2.153.246.051 đuôi không?


Không, trực giác của tôi nói với tôi rằng cơ hội có được một trận đấu chính xác là thấp, chỉ vì con số ngày càng lớn. Nhưng tôi muốn mô phỏng nó chỉ để xác nhận suy nghĩ của tôi. Khi tôi thấy rằng nó bật ra theo cách đó, tôi đã tò mò về lý do chính thức đằng sau tại sao nó lại như vậy. Điều thú vị là tỷ lệ kết quả đang hội tụ về 1 trong khi đồng thời trở nên ít chính xác hơn 1.
trí

3
Một cách nghĩ về điều đó là cho lớn n có nhiều cách khác để gần 50-50 so với cách nhỏ n.
Daniel McLaury
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.