Poisson là theo cấp số nhân như Gamma-Poisson là gì?


16

Phân phối Một Poisson có thể đo lường sự kiện mỗi đơn vị thời gian, và tham số là λ . Phân phối theo cấp số nhân đo thời gian cho đến sự kiện tiếp theo, với tham số 1λ . Người ta có thể chuyển đổi một phân phối thành phân phối khác, tùy thuộc vào việc mô hình hóa các sự kiện hoặc thời gian dễ dàng hơn.

Bây giờ, một gamma-poisson là một poisson "kéo dài" với phương sai lớn hơn. Một phân phối Weibull là một hàm mũ "kéo dài" với phương sai lớn hơn. Nhưng hai cái này có thể dễ dàng chuyển đổi thành nhau, theo cùng một cách Poisson có thể được chuyển đổi thành cấp số nhân?

Hoặc có một số phân phối khác phù hợp hơn để sử dụng kết hợp với phân phối gamma-poisson?

Gamma-poisson còn được gọi là phân phối nhị thức âm, hay NBD.

Câu trả lời:


14

Đây là một vấn đề khá thẳng về phía trước. Mặc dù có một mối liên hệ giữa các phân phối nhị phân Poisson và âm, nhưng tôi thực sự nghĩ rằng điều này không có ích cho câu hỏi cụ thể của bạn vì nó khuyến khích mọi người nghĩ về các quá trình nhị thức âm. Về cơ bản, bạn có một loạt các quy trình Poisson:

Yi(ti)|λiPoisson(λiti)

Trong đó là quá trình và t i là thời gian bạn quan sát nó và tôi biểu thị các cá nhân. Và bạn đang nói rằng các quy trình này là "tương tự" bằng cách buộc các tỷ lệ với nhau bằng một phân phối:Yitii

λiGamma(α,β)

Khi thực hiện tích hợp / kết hợp với , bạn có:λi

Yi(ti)|αβNegBin(α,pi)wherepi=titi+β

Điều này có một pmf của:

Pr(Yi(ti)=yi|αβ)=Γ(α+yi)Γ(α)yi!piyi(1pi)α

Để có được phân phối thời gian chờ đợi, chúng tôi lưu ý rằng:

= 1 - ( 1 - p i ) α = 1 - ( 1 +

Pr(Titi|αβ)=1Pr(Ti>ti|αβ)=1Pr(Yi(ti)=0|αβ)
=1(1pi)α=1(1+tiβ)α

Phân biệt điều này và bạn có bản PDF:

pTi(ti|αβ)=αβ(1+tiβ)(α+1)

Đây là thành viên của bản phân phối Pareto tổng quát, loại II. Tôi sẽ sử dụng điều này như phân phối thời gian chờ đợi của bạn.

Để xem kết nối với phân phối Poisson, lưu ý rằng , do đó nếu chúng ta đặtβ=ααβ=E(λi|αβ) và sau đó đi quá giới hạnalphata có:β=αλα

limααβ(1+tiβ)(α+1)=limαλ(1+λtiα)(α+1)=λexp(λti)

Điều này có nghĩa là bạn có thể giải thích là một tham số phân tán quá mức.1α


1
Bạn cũng có thể lưu ý rằng phân phối thời gian chờ là, đại khái là phân phối theo cấp số nhân với tham số tỷ lệ ngẫu nhiên Gamma và nói đúng đây là phân phối Beta của loại thứ hai, như đối với bất kỳ phân phối Gamma nào có tham số tỷ lệ ngẫu nhiên Gamma.
Stéphane Laurent

Sử dụng @probabilityislogic làm cơ sở, tôi thấy bài viết sau đây cung cấp chi tiết hơn về mối quan hệ giữa NBD và Pareto: Gupta, Sunil và Donald G. Morrison. Ước tính không đồng nhất trong giá mua của người tiêu dùng. Khoa học tiếp thị, 1991, 10 (3), 264-269. Cảm ơn tất cả những người đã giúp tôi trả lời câu hỏi này.
zbicyclist

+1, tôi đoán dạng phân tích tốt đẹp này có thể không còn tồn tại cho , trong đó c là hằng số. Poisson(λiti+c)c
Randel

1
@randel - bạn có thể có được một hình thức "đẹp-ish" bằng cách lưu ý rv này là tổng của hai rv độc lập ... trong đó Y i giống như trên và X ip o i s s o n ( c ) . Vì X tôi không phụ thuộc vào λ i hoặc Y i pdf của Z i là tích chập của pdf nhị thức âm ở trên và pdf poisson. Để có được phân phối thời gian chờ, chỉ cần nhân P rZi=Yi+XiYiXipoisson(c)XiλiYiZi trong câu trả lời trên bởi P r ( X i = 0 ) = e - c . Sau đó, bạn nhận được thời gian chờ cdf là 1 - e - c ( 1 + t iPr(Yi=0)Pr(Xi=0)=ecvà pdf củae-cα1ec(1+tiβ)α. ecαβ(1+tiβ)(α+1)
xác suất

1
Điều này sẽ không hoạt động về mặt phân phối trộn, bởi vì bạn cần (nếu không thì ý nghĩa của poisson là âm). Phân phối trộn gamma sẽ cần phải được cắt bớt (Tôi cũng giả sử rằng c > 0 trong câu trả lời trước của tôi). Điều này có nghĩa là không có phân phối nb. λi<cti1c>0
xác suất

4

Một khả năng: Poisson là theo cấp số nhân là nhị phân âm là ... cấp số nhân!

Có một quá trình Lévy tăng vọt thuần túy được gọi là Quá trình nhị thức âm tính sao cho tại thời điểm giá trị có phân phối nhị thức âm. Không giống như quá trình Poisson, các bước nhảy gần như không chắc chắn 1 . Thay vào đó, họ theo một phân phối logarit . Theo định luật tổng phương sai , một số phương sai xuất phát từ số lần nhảy (được chia theo kích thước trung bình của các lần nhảy) và một số phương sai xuất phát từ kích thước của các lần nhảy và bạn có thể sử dụng điều này để kiểm tra xem là quá liều.t1

Có thể có những mô tả hữu ích khác. Xem "Đóng khung phân phối nhị thức âm cho trình tự DNA."


Hãy để tôi nói rõ hơn về cách Quy trình nhị thức âm được mô tả ở trên có thể được xây dựng.

  • p<1

  • X1,X2,X3,...P(xi=k)=1log(1p)pkk.

  • Nlog(1p)N(t)=Pois(tlog(1p)).

  • NBP

NBP(t)=i=1N(t)Xi.

NBPlog(1p).

NBP(t) has a negative binomial NB(t,p) distribution, but there is a short proof using probability generating functions on Wikipedia, and Fisher also proved this when he introduced the logarithmic distribution to analyze the relative frequencies of species.


1
No, any compound Poisson process has an exponential waiting time. This means you add Pois(λt) IID random variables with some distribution.
Douglas Zare

No, that is not what is meant by a compound Poisson process. en.wikipedia.org/wiki/Compound_Poisson_process " The jumps arrive randomly according to a Poisson process and the size of the jumps is also random, with a specified probability distribution." I did not say IID Poisson variables. You take the Nth partial sum of IID logarithmic random variables where N is the value of a Poisson process.
Douglas Zare

If you multiply a Poisson process by 2, this is not a Poisson process and the waiting times remain exponential.
Douglas Zare


0

I am not able to comment yet so I apologize is this isn't a definitive solution.

You are asking for the appropriate distribution to use with an NB but appropriate isn't entirely defined. If an appropriate distribution means appropriate for explaining data and you are starting with an overdispersed Poisson then you may have to look further into the cause of the overdispersion. The NB doesn't distinguish between a Poisson with heterogeneous means or a positive occurrence dependence (that one event occurring increases the probability of another occurring). In continuous time there is also duration dependence, eg positive duration dependence means the passage of time increases the probability of an occurrence. It was also shown that negative duration dependence asymptotically causes an overdispersed Poisson[1]. This adds to the list of what might be the appropriate waiting time model.


1
cause of the overdispersion: This is consumer purchase data. Individual consumers are poisson, each with a rate of purchase lambda. But not every consumer has the same lambda -- that's the cause of the overdispersion. The lambda purchasing rates are considered to be distributed as gamma. This is a common model (traces back to A.S.C. Ehrenberg), but I haven't found anything in his writing that answers this question.
zbicyclist
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.