Phân phối trung bình làm tròn của các biến ngẫu nhiên Poisson là gì?


20

Nếu tôi có các biến ngẫu nhiên là Poisson được phân phối với các tham số , phân phối của (tức là tầng nguyên của trung bình)?λ 1 , λ 2 , ... , λ n Y = Σ n i = 1 X iX1,X2,,Xnλ1,λ2,,λnY=i=1nXin

Một tổng số Poissons cũng là Poisson, nhưng tôi không đủ tự tin vào số liệu thống kê để xác định xem nó có giống với trường hợp trên không.


@amoeba Tôi quay lại chỉnh sửa tiêu đề của bạn bởi vì đây không thực sự là "làm tròn". Chỉnh sửa trước đó của Cardinal, mặc dù không hoàn toàn chính xác, có vẻ thích hợp hơn vì nó chính xác.
whuber

@whuber Được rồi. Tôi đã do dự khi thực hiện chỉnh sửa này, nhưng đã quyết định đưa từ "làm tròn" bởi vì hiện tại tiêu đề không gợi ý đến khó khăn chính ở đây (và do đó là một cách hiểu sai). Thuật ngữ thích hợp phải là "làm tròn xuống", vì vậy có thể "Phân phối trung bình của các biến ngẫu nhiên Poisson, làm tròn xuống là gì?" - mặc dù tôi sẽ thừa nhận nó nghe có vẻ hơi cồng kềnh.
amip nói rằng Phục hồi Monica

@amoeba Chỉnh sửa thêm tất nhiên được chào đón!
whuber

Câu trả lời:


27

Một khái quát của câu hỏi yêu cầu phân phối khi phân phối được biết và hỗ trợ trên các số tự nhiên. (Trong câu hỏi, có phân phối Poisson tham số và .)X X λ = λ 1 + λ 2 + + λ n m = nY=X/mXXλ=λ1+λ2++λnm=n

Sự phân bố của có thể dễ dàng xác định bởi sự phân bố của , có khả năng tạo ra chức năng (PGF) có thể được xác định trong điều khoản của PGF của . Đây là một phác thảo của phái sinh.m Y XYmYX


Viết cho pgf của , trong đó (theo định nghĩa) . được xây dựng từ theo cách mà pgf, , của nó làX p n = Pr ( X = n ) m Y X qp(x)=p0+p1x++pnxn+Xpn=Pr(X=n)mYXq

q(x)=(p0+p1++pm1)+(pm+pm+1++p2m1)xm++(pnm+pnm+1++p(n+1)m1)xnm+.

Bởi vì điều này hội tụ hoàn toàn cho , chúng ta có thể sắp xếp lại các điều khoản thành một tổng số phần của biểu mẫu|x|1

Dm,tp(x)=pt+pt+mxm++pt+nmxnm+

cho . Chuỗi lũy thừa của các hàm bao gồm mọi thuật ngữ của chuỗi bắt đầu bằng : đôi khi được gọi là số thập phân của . Các tìm kiếm của Google hiện tại không đưa ra nhiều thông tin hữu ích về các số thập phân, vì vậy để hoàn thiện, đây là một công thức.x t D m , t p m th p t th pt=0,1,,m1xtDm,tpmthptthp

Đặt là bất kỳ gốc gốc của sự thống nhất; ví dụ: lấy . Sau đó, nó xuất phát từ và đóm th ω = exp ( 2 i π / m ) ω m = 1 m - 1 j = 0 ω j = 0ωmthω=exp(2iπ/m)ωm=1j=0m1ωj=0

xtDm,tp(x)=1mj=0m1ωtjp(x/ωj).

Để thấy điều này, lưu ý rằng toán tử là tuyến tính, do đó, nó đủ để kiểm tra công thức trên cơ sở . Áp dụng phía bên tay phải để mang đến cho { 1 , x , x 2 , ... , x n , ... } x nxtDm,t{1,x,x2,,xn,}xn

xtDm,t[xn]=1mj=0m1ωtjxnωnj=xnmj=0m1ω(tn)j.

Khi và khác nhau bởi bội số của , mỗi số hạng trong tổng bằng và chúng ta thu được . Mặt khác, các điều khoản xoay quanh các quyền hạn của và các tổng này bằng không. Khi toán tử này bảo toàn tất cả các lũy thừa của đồng quy với modulo và giết chết tất cả các quyền khác: đó chính xác là phép chiếu mong muốn.n m 1 x n ω t - n x t mtnm1xnωtnxtm

Một công thức cho tuân theo dễ dàng bằng cách thay đổi thứ tự tổng hợp và nhận ra một trong các khoản tiền là hình học, do đó viết nó ở dạng đóng:q

q(x)=t=0m1(Dm,t[p])(x)=t=0m1xt1mj=0m1ωtjp(ωjx)=1mj=0m1p(ωjx)t=0m1(ωj/x)t=x(1xm)mj=0m1p(ωjx)xωj.

Ví dụ: pgf của phân phối Poisson của tham số là . Với , và pgf của sẽ làp ( x ) = exp ( λ ( x - 1 ) ) m = 2 ω = - 1 2 Yλp(x)=exp(λ(x1))m=2ω=12Y

q(x)=x(1x2)2j=021p((1)jx)x(1)j=x1/x2(exp(λ(x1))x1+exp(λ(x1))x+1)=exp(λ)(sinh(λx)x+cosh(λx)).

Một cách sử dụng của phương pháp này là để tính toán các khoảnh khắc của và . Giá trị của đạo hàm của pgf được đánh giá tại là thời điểm giai thừa . Các khoảnh khắc là sự kết hợp tuyến tính của người đầu tiên khoảnh khắc thừa. Ví dụ, bằng cách sử dụng các quan sát này, đối với Poisson phân phối , giá trị trung bình của nó (là khoảnh khắc giai thừa đầu tiên) bằng , giá trị trung bình của bằng và giá trị trung bình của bằngm Y k th x = 1 k th k th k X λ 2 ( X / 2 ) λ - 1XmYkthx=1kthkthkXλ2(X/2)3(X/3)λ-1+e-3λ/2(sin ( λ12+12e2λ3(X/3)λ1+e3λ/2(sin(3λ2)3+cos(3λ2)) :

Có nghĩa

Các phương tiện cho được hiển thị bằng màu xanh lam, đỏ và vàng, như các chức năng của : không có triệu chứng, giá trị trung bình giảm theo so với trung bình Poisson ban đầu.λ ( m - 1 ) / 2m=1,2,3λ(m1)/2

Công thức tương tự cho phương sai có thể thu được. (Chúng trở nên lộn xộn khi tăng và do đó bị bỏ qua. Một điều họ chắc chắn thiết lập là khi không có bội số của là Poisson: nó không có sự bình đẳng đặc trưng của trung bình và phương sai) Đây là một âm mưu của phương sai là hàm của cho :m > 1 Y λ m = 1 , 2 , 3mm>1Yλm=1,2,3

Phương sai

Điều thú vị là đối với các giá trị lớn hơn của , phương sai tăng . Theo trực giác, điều này là do hai hiện tượng cạnh tranh: chức năng sàn là ngăn chặn hiệu quả các nhóm giá trị ban đầu là khác biệt; điều này phải làm cho phương sai giảm. Đồng thời, như chúng ta đã thấy, các phương tiện cũng thay đổi (vì mỗi thùng được đại diện bởi giá trị nhỏ nhất của nó); điều này phải gây ra một thuật ngữ bằng bình phương của sự khác biệt của phương tiện được thêm lại. Sự gia tăng phương sai cho lớn trở nên lớn hơn với giá trị lớn hơn của .bước sóng mλλm

Hành vi của phương sai của với rất phức tạp. Hãy kết thúc bằng một mô phỏng nhanh (trong ) cho thấy những gì nó có thể làm. Các sơ đồ cho thấy sự khác biệt giữa phương sai của và phương sai của đối với Poisson phân phối với các giá trị khác nhau của từ đến . Trong mọi trường hợp, các ô dường như đã đạt đến các giá trị tiệm cận của chúng ở bên phải.m m X / m X X λ 1 5000mYmRmX/mXXλ15000

set.seed(17)
par(mfrow=c(3,4))
temp <- sapply(c(1,2,5,10,20,50,100,200,500,1000,2000,5000), function(lambda) {
  x <- rpois(20000, lambda)
  v <- sapply(1:floor(lambda + 4*sqrt(lambda)), 
              function(m) var(floor(x/m)*m) - var(x))
  plot(v, type="l", xlab="", ylab="Increased variance", 
       main=toString(lambda), cex.main=.85, col="Blue", lwd=2)
})

Lô đất


1
Đây là một câu trả lời tuyệt vời! Có lẽ tôi sẽ mất một chút thời gian để tiêu hóa :)
Lubo Antonov

1
và đó là lý do tại sao tôi nói "Sử dụng chức năng sàn ... cũng ảnh hưởng đến phương sai một chút mặc dù theo cách phức tạp hơn."
Henry

1
+1 Cảm ơn câu trả lời chi tiết. Chắc chắn có những cách phức tạp trong đó chức năng sàn ảnh hưởng đến phương sai.
Dilip Sarwate

1
+1 cho mô phỏng trong R với mã --- đây là một ví dụ rất hay về việc sử dụng sapply()cho mô phỏng. Cảm ơn.
Assad Ebrahim

1
@Roberto Cảm ơn bạn. Tuy nhiên, sự khác biệt giữa " " và " ", hoàn toàn là vấn đề ký hiệu, hoàn toàn không quan trọng và không nhập khẩu toán học hay thống kê. sxs
whuber

12

Như Michael Chernick nói, nếu các biến ngẫu nhiên riêng lẻ là độc lập thì tổng là Poisson với tham số (trung bình và phương sai) mà bạn có thể gọi là . λi=1nλiλ

Chia cho làm giảm giá trị trung bình thành và phương sai nên phương sai sẽ nhỏ hơn phân phối Poisson tương đương. Như Michael nói, không phải tất cả các giá trị sẽ là số nguyên.λ / n λ / n 2nλ/nλ/n2

Sử dụng hàm sàn làm giảm trung bình một chút, khoảng và ảnh hưởng đến phương sai một chút mặc dù theo cách phức tạp hơn. Mặc dù bạn có các giá trị nguyên, phương sai vẫn sẽ ít hơn đáng kể so với giá trị trung bình và do đó bạn sẽ có phân phối hẹp hơn Poisson.1212n


cảm ơn, không phải là kết quả mà tôi có thể sử dụng, nhưng ít nhất tôi biết bây giờ :)
Lubo Antonov

Nếu lambdas không bằng nhau, thì kết quả có giống như nhị thức âm hơn là Poisson (bỏ qua phần không nguyên cho thời điểm này) không? Tôi đang thiếu gì ở đây?
gung - Phục hồi Monica

2
@gung: Bạn đang thiếu điểm rằng cá nhân chỉ ảnh hưởng đến việc phân phối thông qua tổng của họ và có bao nhiêu. Việc họ lấy giá trị cụ thể nào không quan trọng: sẽ cho kết quả tương tự như . bước sóng 1 = 1 , λ 2 = 2 , bước sóng 3 = 9 λ 1 = 4 , λ 2 = 4 ,λiλ1=1,λ2=2,λ3=9λ1=4,λ2=4,λ3=4
Henry

10

n iXiXiλiλ=iλi Y =n-1Σ n i = 1 Xik/n

P{i=1nXi=k}=exp(λ)λkk!,  k=0,1,2,,
Y^=n1i=1nXik/nvới xác suất . Lưu ý rằng Yexp(λ)λkk!Y^Y=Y^m
P{Y=m}=P{1ni=1nXi=m}=exp(λ)i=0n1λmn+i(mn+i)!,  m=0,1,2,,
λn

Y

Cảm ơn các công thức nghiêm ngặt! Bất kỳ cơ hội nào bạn muốn có một vết nứt tại các công thức cho trung bình và phương sai?
Lubo Antonov

2
Có lẽ @whuber sẽ đăng một liên kết (hoặc trích dẫn một cuốn sách hoặc bài báo) trong đó có thể tìm thấy các công thức dạng đóng cho các khoảnh khắc hoặc sẽ viết một câu trả lời cho chính các công thức, có hoặc không có dẫn xuất chi tiết.
Dilip Sarwate

@Dilip Yêu cầu của tôi về các công thức đóng không dựa trên bất cứ điều gì được công bố, vì vậy tôi đã đăng một câu trả lời riêng cho biết những gì tôi đã nghĩ và làm thế nào nó có thể được sử dụng để hiểu tình huống này.
whuber

3

Y sẽ không là Poisson. Lưu ý rằng các biến ngẫu nhiên Poisson có các giá trị nguyên không âm. Khi bạn chia cho một hằng số, bạn tạo một biến ngẫu nhiên có thể có các giá trị không nguyên. Nó vẫn sẽ có hình dạng của Poisson. Chỉ là các xác suất rời rạc có thể xảy ra tại các điểm không nguyên.


Y

@ lucas1024 Tôi không nghĩ vậy nhưng tôi không chắc.
Michael R. Chernick

Xin1

@JDav Tổng là Poisson với tham số tỷ lệ bằng tổng của các tham số tỷ lệ riêng. Nhưng OP chia tỷ lệ 1 / n và sau đó muốn cắt bớt số nguyên ngay bên dưới Y. Tôi không biết chính xác điều đó làm gì cho phân phối.
Michael R. Chernick

Nhận xét trước đây của tôi giả định độc lập.
Michael R. Chernick
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.