Nếu tôi có xác suất xảy ra sự kiện, 1% cơ hội và tôi cần sự kiện đó xảy ra nhiều lần, 120 lần, tôi sẽ phải lặp lại sự kiện đó bao nhiêu lần trước khi tôi có thể dự đoán sự kiện đó xảy ra thời gian?
Nếu tôi có xác suất xảy ra sự kiện, 1% cơ hội và tôi cần sự kiện đó xảy ra nhiều lần, 120 lần, tôi sẽ phải lặp lại sự kiện đó bao nhiêu lần trước khi tôi có thể dự đoán sự kiện đó xảy ra thời gian?
Câu trả lời:
Xem xét một chuỗi thử nghiệm độc lập với xác suất thành công. Để cho là số lượng thành công trong số thử nghiệm. Sau đócó phân phối nhị thức với các tham số và . Giá trị mong đợi của rv Binomial là. Một cách tiếp cận đơn giản là đặt giá trị này bằng và giải quyết cho . Từ, chúng ta có có nghĩa là thử nghiệm dự kiến sẽ có được thành công
Ngoài ra, đây là một cách tiếp cận liên quan đưa ra số lượng thử nghiệm cần thiết để quan sát thành công với một số xác suất (I E ).
Xem xét một chuỗi các thử nghiệm độc lập với xác suất thành công . Để cho là số lượng thử nghiệm cần thiết để quan sát thành công Sau đócó phân phối nhị thức âm với các tham số và . Trong trường hợp của bạn,và bạn muốn tìm như vậy mà
Mặc dù phân phối nhị thức âm không có hàm lượng tử dạng đóng, nhưng điều này có thể được giải quyết cho dễ dàng. Chẳng hạn, câu trả lời có thể nhận được bằng R bằng cách gõ : qnbinom(.95, 120, .01)
. Câu trả lời chỉ ra rằng các thử nghiệm được yêu cầu để có 95% cơ hội quan sát (hoặc nhiều hơn) thành công.
qnbinom(.5556, 120, .01)
ở đây: rextester.com/l/r_online_compiler
Đầu tiên, tôi sẽ giả định rằng các thử nghiệm là độc lập vì bạn nói rằng khả năng thành công luôn là 1%. Từ khóa trong câu hỏi của bạn là "mong đợi", có nghĩa là chúng tôi sẽ tìm kiếm một giá trị trung bình hoặc dự kiến .
Nếu bạn quan tâm đến số lượng thử nghiệm (với xác suất thành công chung ), cần thiết để có được thành công, sau đó bạn có thể mô hình hóa nó như một biến ngẫu nhiên nhị thức âm với hàm khối lượng xác suất:
cho
Giá trị kỳ vọng của nhị thức âm được biết đến như:
Trong trường hợp của bạn, và . Vì vậy, số lượng thử nghiệm độc lập dự kiến của thử nghiệm (thời gian) của bạn cần có để đạt được thành công chỉ đơn giản là được đưa ra bởi
Như những người khác đã lưu ý, cơ hội thành công đủ lần sẽ tuân theo phân phối nhị thức âm. Rất hữu ích khi vẽ biểu đồ này và bạn có thể thực hiện điều này trong R với:
plot(function(x) pnbinom(x,120,0.01),120,20000)
Cung cấp cho:
Như bạn có thể thấy nó có hình dạng sigmoidal và có những khu vực rộng lớn hầu như không có cơ hội và gần như chắc chắn và sự thay đổi nhanh chóng giữa hai gần với giá trị mong đợi. Do đó, việc tăng số lượng thử nghiệm có thể ít ảnh hưởng hoặc ảnh hưởng rất lớn đến cơ hội đạt được mục tiêu tùy thuộc vào số lượng bạn đã quyết định.
Nếu bạn chia tỷ lệ hàm này theo số lượng đường (nghĩa là cơ hội cho mỗi thử nghiệm), bạn có thể thấy rằng có một giá trị tối đa rõ ràng,
plot(function(x) pnbinom(x,120,0.01)/x,120,20000)
mà bạn có thể xác định với:
optimise(function(x) pnbinom(x,120,0.01)/x,c(120,20000),maximum=TRUE)
$maximum
[1] 13888
$objective
[1] 6.929301e-05
Như knrumsey nói, số lượng thành công sẽ tuân theo phân phối nhị thức, nhưng trừ khi bạn cần mức độ chính xác cao, 1% là một con số đủ nhỏ để bạn có thể sử dụng xấp xỉ phân phối Poisson với