Chuyển từ mô hình hóa một quy trình bằng cách sử dụng phân phối Poisson để sử dụng phân phối nhị thức âm?


24

Chúng tôi có một quy trình ngẫu nhiên có thể hoặc không thể xảy ra nhiều lần trong một khoảng thời gian . Chúng tôi có nguồn cấp dữ liệu từ một mô hình có sẵn của quy trình này, cung cấp xác suất của một số sự kiện xảy ra trong khoảng thời gian . Mô hình hiện có này đã cũ và chúng tôi cần chạy kiểm tra trực tiếp trên dữ liệu nguồn cấp dữ liệu cho các lỗi ước tính. Mô hình cũ sản xuất các dữ liệu thức ăn chăn nuôi (được cung cấp khả năng các sự kiện xảy ra trong thời gian còn lại ) được xấp xỉ Poisson Distributed.T0t<Tnt

Vì vậy, để kiểm tra xem có bất thường / lỗi, chúng ta để cho t là thời gian còn lại và Xt là tổng số sự kiện xảy ra trong thời gian còn lại t . Mô hình cũ ngụ ý các ước tính P(Xtc) . Vì vậy, theo giả định của chúng tôi XtPoisson(λt) chúng tôi có:

P(Xtc)=eλk=0cλtkk!.
Để lấy tỷ lệ sự kiện của chúng tôi λt từ đầu ra của mô hình cũ (quan sát yt ), chúng tôi sử dụng cách tiếp cận không gian trạng thái và mô hình hóa mối quan hệ trạng thái như:
yt=λt+εt(εtN(0,Ht)).
Chúng tôi lọc các quan sát từ mô hình cũ, sử dụng mô hình không gian trạng thái [phân rã tốc độ không đổi] để tiến hóa λt để thu được trạng thái được lọc E(λt|Yt) và đánh dấu sự bất thường / lỗi trong tần số sự kiện ước tính từ dữ liệu nguồn cấp dữ liệu nếu E(λt|Yt)<yt .

Cách tiếp cận này hoạt động rất tốt trong việc thu thập các lỗi trong sự kiện ước tính được tính trong toàn bộ thời gian T , nhưng không tốt lắm nếu chúng ta muốn làm điều tương tự trong khoảng thời gian khác 0t<σ trong đó σ<23T . Để giải quyết vấn đề này, chúng tôi đã quyết định bây giờ chúng tôi muốn chuyển sang sử dụng phân phối nhị thức âm để bây giờ giả sử XtNB(r,p) và chúng tôi có:

P(Xtc)=prk=0c(1p)k(k+r1r1),
trong đó tham số λ hiện được thay thế bởi rp. Điều này nên đơn giản để thực hiện, nhưng tôi gặp một số khó khăn trong việc giải thích và do đó tôi có một số câu hỏi tôi muốn bạn giúp đỡ:

1. Chúng ta có thể chỉ đặt p=λ trong phân phối nhị thức âm không? Nếu không, tai sao không?

2. Giả sử chúng ta có thể đặt p= =f(λ) trong đó f là một số hàm, làm thế nào chúng ta có thể đặt r chính xác r(chúng ta có cần điều chỉnh r bằng cách sử dụng các tập dữ liệu trong quá khứ) không?

3. Có phải r phụ thuộc vào số lượng sự kiện chúng ta dự kiến ​​sẽ xảy ra trong một quy trình nhất định không?


Phụ lục trích xuất ước tính cho r (và p ):

Tôi biết rằng nếu trên thực tế chúng tôi có vấn đề này được đảo ngược và chúng tôi có số lượng sự kiện cho mỗi quy trình, chúng tôi có thể áp dụng công cụ ước tính khả năng tối đa cho và . Tất nhiên, công cụ ước tính khả năng tối đa chỉ tồn tại đối với các mẫu có phương sai mẫu lớn hơn giá trị trung bình mẫu, nhưng nếu đây là trường hợp chúng ta có thể đặt hàm khả năng cho các quan sát phân phối nhận độc lập as: từ đó chúng ta có thể viết hàm khả năng đăng nhập là: p N k 1 , k 2 , ... , k N L ( r , p ) = N Π i = 1 P ( k i ; r , p ) , l ( r , p ) = N Σ i = 1 ln ( Γ ( k i + r ) ) - = 1 lnrpNk1,k2,Giáo dục,kN

L(r,p)= =Πtôi= =1NP(ktôi;r,p),
r p r l ( r , p )
l(r,p)=i=1Nln(Γ(ki+r))i=1Nln(ki!)Nln(Γ(r))+i=1Nkiln(p)+Nrln(1p).
Để tìm mức tối đa, chúng tôi lấy các đạo hàm riêng đối với và và đặt chúng bằng 0: Cài đặt và đặt chúng tôi tìm thấy: rprl(r,p)=pl(r,p)=0p= N i = 1 k i
rl(r,p)=i=1Nψ(ki+r)Nψ(r)+Nln(1p),pl(r,p)=i=1Nki1pNr11p.
rl(r,p)=pl(r,p)=0p=i=1Nki(Nr+i=1Nki),
rtôi(r,p)= =Σtôi= =1Nψ(ktôi+r)-Nψ(r)+Nln(rr+Σtôi= =1NktôiN)= =0.
Phương trình này không thể được giải cho r ở dạng đóng bằng Newton hoặc thậm chí EM. Tuy nhiên, đây không phải là trường hợp trong tình huống này. Mặc dù chúng tôi có thể sử dụng dữ liệu trong quá khứ để có được một và nhưng điều này thực sự không được sử dụng như quy trình của chúng tôi, chúng tôi cần điều chỉnh các tham số này kịp thời, giống như chúng tôi đã sử dụng Poisson. rp

1
Tại sao không chỉ cắm dữ liệu của bạn vào mô hình hồi quy nhị phân Poisson hoặc âm tính?
StatsStudent 17/2/2016

1
Tôi không cảm thấy cần phải được sử dụng. Lưu ý rằng Poisson là trường hợp giới hạn của Binomial âm, nên có một số cách để tham số hóa vấn đề này theo cách tương tự tôi đã làm cho Poisson. Ngoài ra, quá trình này xảy ra đồng thời cho hàng ngàn quy trình khác nhau và không ai có cùng "tỷ lệ sự kiện", nghĩa là phân tích hồi quy cho các tham số này sẽ phải được thực hiện ở mỗi lần quan sát mới cho tất cả các quy trình trực tiếp. Điều này là không khả thi. Cảm ơn rất nhiều vì đã dành thời gian để đọc câu hỏi và nhận xét của tôi, nó được đánh giá cao nhất ...
MoonKnight

1
Về mặt liên kết poisson với NB, nếu bạn có với ẩn trên biến phân tán sao cho và . Điều này sẽ cung cấp một phân phối NB cận biên khi tích hợp . Bạn có thể sử dụng điều này để giúp đỡ. (Xt|λt,rt,gt)PotôiS(λtgt)(gt|rt)~Gmộtmmmột(rt,rt)E(gt)= =1vmộtr(gt)= =rt-1gt
xác suất

Đó là một sự trợ giúp tuyệt vời, nhưng bạn có thể bổ sung thêm một chút và cung cấp một số chi tiết rõ ràng không? Cảm ơn rất nhiều về thời gian của bạn ...
MoonKnight

1
Còn việc sử dụng nhị thức chứ không phải nhị thức âm thì sao? Điều đó có thể dễ dàng hơn để làm. Anscombe FJ. Việc chuyển đổi dữ liệu nhị phân, nhị thức và nhị thức âm. Sinh trắc học. 1948; 35: 246-54.
Carl

Câu trả lời:


1

Phân phối nhị thức âm rất giống với mô hình xác suất nhị thức. nó được áp dụng khi các giả định (điều kiện) sau đây giữ tốt 1) Bất kỳ thử nghiệm nào được thực hiện trong cùng điều kiện cho đến khi đạt được số lần thành công cố định, như C, đạt được 2) Kết quả của mỗi thử nghiệm có thể được phân loại thành một trong hai loại , thành công hay thất bại 3) Xác suất P thành công là như nhau đối với mỗi thí nghiệm 40 Thử nghiệm độc lập với tất cả các thí nghiệm khác. Điều kiện đầu tiên là yếu tố khác biệt duy nhất giữa nhị thức nhị thức và nhị thức âm


0

Phân phối poisson có thể là một xấp xỉ hợp lý của nhị thức trong các điều kiện nhất định như 1) Xác suất thành công cho mỗi thử nghiệm là rất nhỏ. P -> 0 2) np = m (nói) là hoàn thiện Quy tắc thường được sử dụng bởi các nhà thống kê là poisson là một xấp xỉ tốt của nhị thức khi n bằng hoặc lớn hơn 20 và p bằng hoặc nhỏ hơn 5 %

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.