Phân phối xác suất của tổng ngẫu nhiên các biến Bernoulli không iid này là gì?


9

Tôi đang cố gắng tìm phân phối xác suất của một tổng số lượng biến ngẫu nhiên không được phân phối giống hệt nhau. Đây là một ví dụ:

John làm việc tại một trung tâm dịch vụ khách hàng. Anh ta nhận được các cuộc gọi có vấn đề và cố gắng giải quyết chúng. Những người anh không thể giải quyết, anh chuyển chúng cho cấp trên của mình. Giả sử rằng số lượng cuộc gọi anh ta nhận được trong một ngày tuân theo phân phối Poisson với giá trị trung bình . Độ khó của từng vấn đề khác nhau, từ những thứ khá đơn giản (mà anh ấy chắc chắn có thể giải quyết) đến những câu hỏi rất chuyên môn mà anh ấy sẽ không biết cách giải quyết. Giả sử rằng xác suất p i ông sẽ có thể giải quyết vấn i vấn đề -thứ tuân theo phân phối Beta với các thông số alphaβ và không phụ thuộc vào vấn đề trước. Sự phân phối số lượng cuộc gọi anh ta giải quyết trong một ngày là gì?μpiαβ

Chính thức hơn, tôi có:

cho i = 0 , 1 , 2 , . . . , NY=I(N>0)i=0NXii=0,1,2,...,N

nơi , ( X i | p i ) ~ B e r n o u l l i ( p i )p i ~ B e t một ( α , β )NPoisson(μ)(Xi|pi)Bernoulli(pi)piBeta(α,β)

Lưu ý rằng, hiện tại, tôi rất vui khi cho rằng là độc lập. Tôi cũng chấp nhận rằng các thông số L , αβ không ảnh hưởng lẫn nhau mặc dù trong một ví dụ thực tế cuộc sống này khi μ là lớn, các thông số alphaβ rất như vậy mà phân phối Beta có khối lượng thêm về thành công thấp tỷ lệ p . Nhưng bây giờ hãy bỏ qua điều đó.Xiμ,αβμαβp

Tôi có thể tính nhưng đó là về nó. Tôi cũng có thể mô phỏng các giá trị để có ý tưởng về sự phân bố của Y trông như thế nào (trông giống như Poisson nhưng tôi không biết liệu đó có phải là con số của μ , αβ Tôi đã thử hay liệu nó có khái quát không, và nó có khái quát không có thể thay đổi cho các giá trị tham số khác nhau). Bất kỳ ý tưởng về phân phối này là gì hoặc làm thế nào tôi có thể đi về việc tạo ra nó?P(Y=0)Yμ,αβ

Xin lưu ý rằng tôi cũng đã đăng câu hỏi này trên Diễn đàn TalkStats nhưng tôi nghĩ rằng nó có thể được chú ý nhiều hơn ở đây. Xin lỗi vì đăng chéo và cảm ơn nhiều về thời gian của bạn.

EDIT : Hóa ra (xem các câu trả lời rất hữu ích dưới đây - và cảm ơn vì những điều đó!), Đó thực sự là một Phân phối α + β ), một cái gì đó mà tôi đã đoán dựa trên trực giác của tôi và một số mô phỏng, nhưng không thể chứng minh. Những gì tôi bây giờ thấy mặc dù đáng ngạc nhiên, đó là sự phân bố Poisson chỉ phụ thuộc vào giá trị trung bình củaBetmộtphân phối nhưng không bị ảnh hưởng bởi biến của nó.Poisson(μαα+β)Beta

Ví dụ, hai bản phân phối Beta sau đây có cùng phương sai nhưng khác nhau. Để rõ ràng, pdf màu xanh đại diện cho và màu đỏ B e t a ( 0,75 , 0,75 ) .Beta(2,2)Beta(0.75,0.75)

Phân phối Beta

Tuy nhiên, họ sẽ cả kết quả trong cùng phân phối đó, với tôi, dường như hơi phản trực giác. (Không nói rằng kết quả là sai, chỉ đáng ngạc nhiên!)Poisson(0.5μ)


N

N

Bạn có thể xem qua hợp chất Poisson , nhưng bạn có thể cần thực hiện một số công việc với số 0 để làm cho nó hữu ích
Glen_b -Reinstate Monica

Câu trả lời:


6

XiNXi=1Xi=01Xi=1p1pμ. Trong thực tế đây là trường hợp, chúng tôi chỉ cần một bước bổ sung để đạt được điều đó.

pi

Pr(Xi|α,β)=01piXi(1pi)1Xipiα1(1pi)β1B(α,β)dpi=B(Xi+α,1Xi+β)B(α,β)

B(a,b)=Γ(a)Γ(b)Γ(a+b)Γ(x+1)=xΓ(x)

Pr(Xi=1|α,β)=Γ(1+α)Γ(β)Γ(1+α+β)Γ(α+β)Γ(α)Γ(β)=αα+β
XiBernoulli(αα+β)Yαμα+β

Một ví dụ bằng số (với R) ... trong hình, các đường thẳng đứng là từ mô phỏng và các điểm màu đỏ là pmf xuất phát ở trên:

draw <- function(alpha, beta, mu) 
{ N <- rpois(1, mu); p = rbeta(N, alpha, beta); sum(rbinom(N, size=1, prob=p)) }

pmf <- function(y, alpha, beta, mu)
  dpois(y, alpha*mu/(alpha+beta))

y <- replicate(30000,draw(4,5,10))
tb <- table(y)

# simulated pmf
plot(tb/sum(tb), type="h", xlab="Y", ylab="Probability")
# analytic pmf
points(0:max(y), pmf(0:max(y), 4, 5, 10), col="red")

nhập mô tả hình ảnh ở đây


3
  1. piBeta(α,β)E[pi]=αα+βi

  2. μαα+βμαα+β

  3. P(Y=0)=eμα/(α+β)

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.