Đã bao nhiêu lần lặp lại một sự kiện với xác suất đã biết trước khi nó xảy ra một số lần


7

Nếu tôi có xác suất xảy ra sự kiện, 1% cơ hội và tôi cần sự kiện đó xảy ra nhiều lần, 120 lần, tôi sẽ phải lặp lại sự kiện đó bao nhiêu lần trước khi tôi có thể dự đoán sự kiện đó xảy ra thời gian?


17
Làm thế nào chắc chắn bạn muốn là sự kiện sẽ xảy ra số lần đó?
Jake Westfall

Chạy thử nghiệm như vậy 100 lần sẽ có tỷ lệ thất bại là 1 trong e. Theo quan điểm của jake, chúng tôi cần thêm chi tiết để đưa ra câu trả lời hợp lệ.
JTP - Xin lỗi Monica

1
Mong đợi một sự kiện 120 lần và cần một sự kiện 120 thời gian được tính widly thứ khác nhau.
Vịt Mooing

Một nơi nào đó giữa 120 và vô cùng.
Bob Jarvis - Tái lập Monica

Câu trả lời:


19

Xem xét một chuỗi thử nghiệm độc lập với xác suất thành côngnp. Để choX là số lượng thành công trong số nthử nghiệm. Sau đóXphân phối nhị thức với các tham sốnp. Giá trị mong đợi của rv Binomial làE(X)=np. Một cách tiếp cận đơn giản là đặt giá trị này bằng120 và giải quyết cho n. Từp=0.01, chúng ta có n(0.01)=120 có nghĩa là n=12,000 thử nghiệm dự kiến ​​sẽ có được 120 thành công


Ngoài ra, đây là một cách tiếp cận liên quan đưa ra số lượng thử nghiệm cần thiết để quan sát r=120 thành công với một số xác suất γ (I E γ=0.95).

Xem xét một chuỗi các thử nghiệm độc lập với xác suất thành công p. Để choX là số lượng thử nghiệm cần thiết để quan sát rthành công Sau đóXphân phối nhị thức âm với các tham sốrp. Trong trường hợp của bạn,XNegative-Binomial(120,0.01)và bạn muốn tìm x như vậy mà

P(Xx)=γ.

Mặc dù phân phối nhị thức âm không có hàm lượng tử dạng đóng, nhưng điều này xcó thể được giải quyết cho dễ dàng. Chẳng hạn, câu trả lời có thể nhận được bằng R bằng cách gõ : qnbinom(.95, 120, .01). Câu trả lờix=13728 chỉ ra rằng 13,728 các thử nghiệm được yêu cầu để có 95% cơ hội quan sát 120 (hoặc nhiều hơn) thành công.


1
Phương thức đầu tiên tương đương với phương pháp thứ hai với γ=0.5, chính xác?
jpmc26

@ jpmc26 Tôi nhận 0,5556 cho 12000. Tôi đã sử dụng qnbinom(.5556, 120, .01)ở đây: rextester.com/l/r_online_compiler
Maxter

@ jpmc26, phương pháp đầu tiên sẽ cho câu trả lời tương tự như phương pháp thứ hai với γ=0.5.. nhưng chúng không tương đương. Cách tiếp cận đầu tiên là số lượng thử nghiệm dự kiến ​​(giá trị trung bình) và cách tiếp cận thứ hai có thể được coi là số lượng thử nghiệm trung bình.
knrumsey

5

Đầu tiên, tôi sẽ giả định rằng các thử nghiệm là độc lập vì bạn nói rằng khả năng thành công luôn là 1%. Từ khóa trong câu hỏi của bạn là "mong đợi", có nghĩa là chúng tôi sẽ tìm kiếm một giá trị trung bình hoặc dự kiến .

Nếu bạn quan tâm đến số lượng thử nghiệm X (với xác suất thành công chung p), cần thiết để có được r thành công, sau đó bạn có thể mô hình hóa nó như một biến ngẫu nhiên nhị thức âm với hàm khối lượng xác suất:

fX(x|r,p)=(x1r1)pr(1p)xr

cho x=r,r+1,...,

Giá trị kỳ vọng của nhị thức âm được biết đến như:

E(X)=rp

Trong trường hợp của bạn, p=0.01r=120. Vì vậy, số lượng thử nghiệm độc lập dự kiến ​​của thử nghiệm (thời gian) của bạn cần có để đạt được120 thành công chỉ đơn giản là được đưa ra bởi 120/0.01=12,000


Nitpick: Nói xác suất luôn là 1% không giống như các thử nghiệm độc lập
DreamConspiracy

1
@DreamConspiracy, không có tranh chấp ở đây. Tôi đã suy luận từ mô tả của OP. Trong trường hợp PMF NB có các sự kiện độc lập, chắc chắn sẽ xảy ra trường hợp xác suất sự kiện là không đổi.
StatsStudent

1

Như những người khác đã lưu ý, cơ hội thành công đủ lần sẽ tuân theo phân phối nhị thức âm. Rất hữu ích khi vẽ biểu đồ này và bạn có thể thực hiện điều này trong R với:

plot(function(x) pnbinom(x,120,0.01),120,20000)

Cung cấp cho:

Phân phối nhị thức âm

Như bạn có thể thấy nó có hình dạng sigmoidal và có những khu vực rộng lớn hầu như không có cơ hội và gần như chắc chắn và sự thay đổi nhanh chóng giữa hai gần với giá trị mong đợi. Do đó, việc tăng số lượng thử nghiệm có thể ít ảnh hưởng hoặc ảnh hưởng rất lớn đến cơ hội đạt được mục tiêu tùy thuộc vào số lượng bạn đã quyết định.

Nếu bạn chia tỷ lệ hàm này theo số lượng đường (nghĩa là cơ hội cho mỗi thử nghiệm), bạn có thể thấy rằng có một giá trị tối đa rõ ràng,

plot(function(x) pnbinom(x,120,0.01)/x,120,20000)

Cơ hội trung bình cho mỗi thử nghiệm

mà bạn có thể xác định với:

optimise(function(x) pnbinom(x,120,0.01)/x,c(120,20000),maximum=TRUE)
$maximum
[1] 13888

$objective
[1] 6.929301e-05

-1

Như knrumsey nói, số lượng thành công sẽ tuân theo phân phối nhị thức, nhưng trừ khi bạn cần mức độ chính xác cao, 1% là một con số đủ nhỏ để bạn có thể sử dụng xấp xỉ phân phối Poisson vớiλ=1201%99%=1.2121


4
Làm thế nào chính xác một người sẽ "sử dụng" phân phối Poisson này để trả lời câu hỏi?
whuber

Và tại sao bạn lại nhân lên 120 bởi 1%(thay vì chia cái này cho cái kia)?
Henry

2
1.2 gì? thử nghiệm?
qwr

1
Tôi thích ý tưởng sử dụng phân phối Poisson và rất vui vì bạn đã đưa nó lên, nhưng câu trả lời của bạn hiện đang bị nhầm lẫn. ĐểF(k,μ) là giá trị của Poisson(μ) CDF và 1α cơ hội mong muốn quan sát ít nhất n lần xuất hiện, bạn có thể đặt câu hỏi này là tìm nhỏ nhất nF(1201,nλ)α Ở đâu λ=1/100. Câu trả lời không liên quan đến Poisson(120×1/100/(11/100))phân phối! Quan tâm là kết nối với phân phối Gamma: giải pháp làF12011(1α) Ở đâu F1201 là Gamma(1201)CDF.
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.