Tôi nên sử dụng một cdf nhị thức hoặc một cdf bình thường khi lật tiền?


11

Một đồng xu cần phải được kiểm tra tính công bằng. 30 cái đầu xuất hiện sau 50 lần lật. Giả sử đồng tiền là công bằng, xác suất mà bạn sẽ nhận được ít nhất 30 đầu trong 50 lần lật là bao nhiêu?

Cách đúng đắn để làm vấn đề này, theo giáo viên của tôi, là làm

normalcdf(min = .6, max = ∞, p = .5, σ = sqrt(.5 * .5 / 50) = 0.0786

Tuy nhiên, tôi đã lấy một hàm phân phối tích lũy nhị thức như thế này

1 - binomcdf(n = 50, p = .5, x = 29) = 0.1013

Tôi tin rằng các tiêu chí cho phân phối nhị thức được thỏa mãn: các sự kiện riêng lẻ là độc lập, chỉ có hai kết quả có thể xảy ra (đầu so với đuôi), xác suất không đổi cho câu hỏi (0,5) và số lượng thử nghiệm được cố định ở mức 50 Tuy nhiên, rõ ràng, hai phương pháp đưa ra các câu trả lời khác nhau và một mô phỏng hỗ trợ câu trả lời của tôi (ít nhất là vài lần tôi chạy nó; rõ ràng, tôi không thể đảm bảo rằng bạn sẽ nhận được kết quả tương tự).

Có phải giáo viên của tôi đã sai khi cho rằng đường cong phân phối Bình thường cũng sẽ là một cách hợp lệ để thực hiện vấn đề này (không có gì nói rằng phân phối là Bình thường, nhưng n * pn * (1-p) đều lớn hơn 10), hoặc tôi đã hiểu nhầm điều gì đó về phân phối nhị thức?


5
Một người có kinh nghiệm sử dụng các xấp xỉ Bình thường cho Binomial sẽ tiến hành khác đi một chút: họ sẽ áp dụng hiệu chỉnh liên tục (thông thường) , như trong 1 - pnorm((30-0.5)/50, mean=0.5, sd=sqrt(0.5*(1-0.5)/50))(đây là biểu thức R), có giá trị là 0.1015, phù hợp khá chặt chẽ với cdf Binomial .
whuber

Câu trả lời:


10

Dưới đây là một minh họa về các câu trả lời của whuber và onestop.

điều chỉnh liên tục

Màu đỏ phân phối nhị thức , màu đen mật độ của xấp xỉ bình thường và màu xanh lam bề mặt tương ứng với cho .Bin(50,0.5)N(25,12.5)P(Y>29.5)YN(25,12.5)

Chiều cao của thanh màu đỏ tương ứng với cho được xấp xỉ bằng . Để có được xấp xỉ tốt , bạn cần sử dụng .P(X=k)XBin(50,0.5)P(X30)P(Y>29,5)P(k12<Y<k+12)P(X30)P(Y>29.5)

(chỉnh sửa) Đây là (thu được bằng R bởi ) trong khi phép tính gần đúng là đúng.P ( X 30 ) 0.1013194 :

P(Y>29.5)0.1015459,
1-pnorm(29.5,25,sqrt(12.5))
P(X30)0.1013194:

Điều này được gọi là điều chỉnh liên tục . Nó cho phép bạn tính cả "xác suất điểm" như : P(X=22)

P(X=22)=(5022)0.5220.5280.07882567,P(21.5<Y<22.5)0.23975010.16109940.07865066.

4

Phân phối chuẩn cho phép tính gần đúng với nhị thức nếu bạn sử dụng hiệu chỉnh liên tục . Sử dụng điều này cho ví dụ của bạn, tôi nhận được 0.1015. Vì đây là bài tập về nhà, tôi sẽ để lại cho bạn để điền vào các chi tiết.


4

Xem xét điều này. Trong phân phối nhị thức rời rạc, bạn có xác suất thực tế cho các số riêng lẻ. Trong trường hợp bình thường liên tục không phải là trường hợp, bạn cần một loạt các giá trị. Vậy ... nếu bạn định tính gần đúng xác suất của một giá trị riêng lẻ, giả sử X, từ nhị thức với bình thường, bạn sẽ làm thế nào? Nhìn vào biểu đồ xác suất của phân phối nhị thức với đường cong bình thường đặt trên nó. Bạn sẽ thực sự cần phải chọn từ X ± 0,5 để nắm bắt một cái gì đó tương tự như xác suất nhị thức của X với xấp xỉ bình thường.

Bây giờ mở rộng điều đó đến khi bạn chọn một đuôi của phân phối. Khi bạn sử dụng phương pháp nhị thức, bạn chọn toàn bộ xác suất của giá trị (30 trong trường hợp của bạn) cộng với mọi thứ cao hơn. Do đó, khi bạn thực hiện liên tục, bạn phải đảm bảo rằng bạn nắm bắt được điều đó và chọn 0,5 ít hơn, do đó mức cắt trên phân phối liên tục là 29,5.


3
Trên thực tế, câu hỏi thể hiện sự hiểu biết sâu sắc về vấn đề và dường như không tìm kiếm câu trả lời cho câu hỏi bài tập về nhà thông thường. Mặc dù nó được gắn thẻ bài tập về nhà , hãy xem xét tạo một ngoại lệ ở đây. Đặc biệt, một cuộc thảo luận tốt về việc sử dụng phân phối Bình thường để xấp xỉ các phân phối rời rạc (như Binomials và Poissons với N lớn) sẽ phù hợp và được chào đón nhất ở đây.
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.