Xấp xỉ đơn giản của phân phối tích lũy Poisson ở đuôi dài?


10

Tôi muốn quyết định dung lượng của một bảng để nó có tỷ lệ cược dư nhỏ hơn để tràn cho , giả sử số lượng mục nhập theo luật Poisson với một giá trị đã cho kỳ vọng .C2pp[40120]E[1031012]

Lý tưởng nhất, tôi muốn số nguyên thấp nhất Csao 1-CDF[PoissonDistribution[E],C] < 2^-pcho cho pE; nhưng tôi hài lòng với một số Ccao hơn một chút. Mathematica là tốt cho tính toán thủ công, nhưng tôi muốn tính toán Ctừ pEtại thời điểm biên dịch, điều này giới hạn tôi trong số học số nguyên 64 bit.

Cập nhật: Trong Mathicala (phiên bản 7) e = 1000; p = 40; c = Quantile[PoissonDistribution[e], 1 - 2^-p]1231và có vẻ đúng (cảm ơn @Procrastinator); tuy nhiên, kết quả cho cả hai p = 50p = 601250sai ở khía cạnh không an toàn (và vấn đề: thử nghiệm của tôi lặp lại như lần trở lên và tôi muốn tỷ lệ thất bại chung thấp hơn ). Tôi muốn một số xấp xỉ thô nhưng an toàn chỉ sử dụng số học 64 bit , như có sẵn trong C (++) tại thời điểm biên dịch.225230


1
Thế còn C = Quantile[PoissonDistribution[E],1-2^p]?

1
Thuật ngữ hàng đầu của hàm khối lượng xác suất của Poisson chiếm ưu thế ở phần đuôi.
Đức hồng y

1
@Procrastinator: có hoạt động trong Mathicala (ngoại trừ dấu hiệu p, và các vấn đề chính xác, và tên ECđược bảo lưu). NHƯNG tôi cần một xấp xỉ đơn giản về điều đó, có thể là thô (nhưng về mặt an toàn) chỉ sử dụng số học số nguyên 64 bit!
fgrieu

3
Cập nhật lại: Mathicala 8 trả về 1262 cho và 1290 cho . Re xấp xỉ bình thường (@Proc): điều này không thể được dự kiến ​​sẽ hoạt động tốt trong các đuôi, điều này rất quan trọng cho việc tính toán. p=50p=60
whuber

1
Có lẽ bạn nên hỏi về stackoverflow. Tôi không quen thuộc với những hạn chế bạn có. Tôi không biết điều gì ngăn bạn sử dụng phân bổ bộ nhớ động hoặc liệu bạn có thể sử dụng phân nhánh để quyết định kích thước của mảng hay chi phí để xác định một mảng có kích thước gấp đôi bạn cần (và sau đó không sử dụng tất cả của nó). Nếu một số chức năng như (chỉ là một ví dụ) đã đưa ra bạn có câu trả lời chính xác không, bạn có thể thực hiện một phép tính gần đúng theo các ràng buộc của mình hay không? Có vẻ như một vấn đề lập trình bây giờ. μ+loglogμlogμμ+pμlogμ
Douglas Zare

Câu trả lời:


10

Một phân phối Poisson với giá trị trung bình lớn là xấp xỉ bình thường, nhưng bạn phải cẩn thận rằng bạn muốn có một cái đuôi bị ràng buộc và phép tính gần đúng bình thường có độ chính xác thấp hơn gần đuôi.

Một cách tiếp cận được sử dụng trong câu hỏi MO này và với các phân phối nhị thức là nhận ra rằng đuôi giảm nhanh hơn một loạt hình học, vì vậy bạn có thể viết một giới hạn trên rõ ràng như một chuỗi hình học.

k=Dexp(μ)μkk!<k=Dexp(μ)μDD!(μD+1)kD=exp(μ)μDD!11μD+1<exp(μ)μD2πD(D/e)D11μD+1=exp(Dμ)(μD)DD+12πD(D+1μ)

Dòng 2 dòng 3 có liên quan đến công thức của Stirling. Trong thực tế tôi nghĩ bạn sau đó muốn giải quyết bằng cách sử dụng tìm kiếm nhị phân. Phương pháp của Newton bắt đầu bằng dự đoán ban đầu vềcũng nên làm việcplog2=log(bound)D=μ+cμ.

Ví dụ: với và , giải pháp số tôi nhận được là 1384,89. Phân phối Poisson với giá trị trung bình lấy các giá trị từ đến với xác suấtCác giá trị đến xảy ra với xác suấtp=100μ=100010000138411/2100.06.0138311/299.59.


1
+1. Một cách tiếp cận khác liên quan đến xác suất đuôi Poisson (ở bên phải) với xác suất đuôi của phân phối Gamma (ở bên trái), có thể được ước tính gần đúng (hơn) với xấp xỉ điểm yên.
whuber

Có một chặng đường dài từ đó đến một cái gì đó bị giới hạn trong số học số nguyên 64 bit (không có exp, log, sqrt ..) nhưng tôi sẽ làm việc với nó; cảm ơn tất cả!
fgrieu

(1) Tính đến gọi trình xấp xỉ Stirling (mà là không thích hợp), điều này được chính xác các ràng buộc tôi (opaquely) tham khảo trong bình luận của tôi vào OP. (Ví dụ, xem tại đây .)
hồng y

2

Bạn có thể thấy P. Harremoës: Giới hạn sắc nét về xác suất đuôi đối với các biến ngẫu nhiên Poisson https://aineda.helsinki.fi/bitstream/handle/10138/229679/witmse_proc_17.pdf Các bất đẳng thức chính như sau. Đặt là biến ngẫu nhiên Poisson với tham số . Đặt Gọi là hàm phân phối tích lũy cho luật bình thường tiêu chuẩn. Sau đó, với tất cả số nguyên , tương đương với cho tất cả các số nguyênYλ

G(x)=2(xlnxλ+λx)  sign(xλ).
Φk0
P(Y<k)Φ(G(k))P(Yk),
Φ(G(k1))P(Y<k)Φ(G(k))
k>0. Hơn nữa, ngụ ý rằng với mọi số nguyên .Φ(G(k+(1/2)))P(Yk)
Φ(G(k1/2))P(Y<k)Φ(G(k))
k>0


Nếu bạn có thể viết ra phương trình chính (giả sử chỉ có một hoặc hai) sẽ giúp ích trong trường hợp liên kết bị chết vào một lúc nào đó.
jbowman
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.