Chúng tôi có một quy trình ngẫu nhiên có thể hoặc không thể xảy ra nhiều lần trong một khoảng thời gian . Chúng tôi có nguồn cấp dữ liệu từ một mô hình có sẵn của quy trình này, cung cấp xác suất của một số sự kiện xảy ra trong khoảng thời gian . Mô hình hiện có này đã cũ và chúng tôi cần chạy kiểm tra trực tiếp trên dữ liệu nguồn cấp dữ liệu cho các lỗi ước tính. Mô hình cũ sản xuất các dữ liệu thức ăn chăn nuôi (được cung cấp khả năng các sự kiện xảy ra trong thời gian còn lại ) được xấp xỉ Poisson Distributed.T0≤t<Tnt
Vì vậy, để kiểm tra xem có bất thường / lỗi, chúng ta để cho t là thời gian còn lại và Xt là tổng số sự kiện xảy ra trong thời gian còn lại t . Mô hình cũ ngụ ý các ước tính P(Xt≤c) . Vì vậy, theo giả định của chúng tôi Xt∼Poisson(λt) chúng tôi có:
P(Xt≤c)=e−λ∑k=0cλktk!.
Để lấy tỷ lệ sự kiện của chúng tôi
λt từ đầu ra của mô hình cũ (quan sát
yt ), chúng tôi sử dụng cách tiếp cận không gian trạng thái và mô hình hóa mối quan hệ trạng thái như:
yt=λt+εt(εt∼N(0,Ht)).
Chúng tôi lọc các quan sát từ mô hình cũ, sử dụng mô hình không gian trạng thái [phân rã tốc độ không đổi] để tiến hóa
λt để thu được trạng thái được lọc
E(λt|Yt) và đánh dấu sự bất thường / lỗi trong tần số sự kiện ước tính từ dữ liệu nguồn cấp dữ liệu nếu
E(λt|Yt)<yt .
Cách tiếp cận này hoạt động rất tốt trong việc thu thập các lỗi trong sự kiện ước tính được tính trong toàn bộ thời gian T , nhưng không tốt lắm nếu chúng ta muốn làm điều tương tự trong khoảng thời gian khác 0≤t<σ trong đó σ<23T . Để giải quyết vấn đề này, chúng tôi đã quyết định bây giờ chúng tôi muốn chuyển sang sử dụng phân phối nhị thức âm để bây giờ giả sử Xt∼NB(r,p) và chúng tôi có:
P(Xt≤c)=pr∑k=0c(1−p)k(k+r−1r−1),
trong đó tham số
λ hiện được thay thế bởi
r và
p. Điều này nên đơn giản để thực hiện, nhưng tôi gặp một số khó khăn trong việc giải thích và do đó tôi có một số câu hỏi tôi muốn bạn giúp đỡ:
1. Chúng ta có thể chỉ đặt p = λ trong phân phối nhị thức âm không? Nếu không, tai sao không?
2. Giả sử chúng ta có thể đặt p = f( λ ) trong đó f là một số hàm, làm thế nào chúng ta có thể đặt r chính xác r(chúng ta có cần điều chỉnh r bằng cách sử dụng các tập dữ liệu trong quá khứ) không?
3. Có phải r phụ thuộc vào số lượng sự kiện chúng ta dự kiến sẽ xảy ra trong một quy trình nhất định không?
Phụ lục trích xuất ước tính cho r (và p ):
Tôi biết rằng nếu trên thực tế chúng tôi có vấn đề này được đảo ngược và chúng tôi có số lượng sự kiện cho mỗi quy trình, chúng tôi có thể áp dụng công cụ ước tính khả năng tối đa cho và . Tất nhiên, công cụ ước tính khả năng tối đa chỉ tồn tại đối với các mẫu có phương sai mẫu lớn hơn giá trị trung bình mẫu, nhưng nếu đây là trường hợp chúng ta có thể đặt hàm khả năng cho các quan sát phân phối nhận độc lập as:
từ đó chúng ta có thể viết hàm khả năng đăng nhập là:
p N k 1 , k 2 , ... , k N L ( r , p ) = N Π i = 1 P ( k i ; r , p ) , l ( r , p ) = N Σ i = 1 ln ( Γ ( k i + r ) ) - = 1 lnrpNk1, k2, ... , kN
L ( r , p ) = Πi = 1NP ( ktôi; r , p ) ,
r p ∂ r l ( r , p )l(r,p)=∑i=1Nln(Γ(ki+r))−∑i=1Nln(ki!)−Nln(Γ(r))+∑i=1Nkiln(p)+Nrln(1−p).
Để tìm mức tối đa, chúng tôi lấy các đạo hàm riêng đối với và và đặt chúng bằng 0:
Cài đặt và đặt chúng tôi tìm thấy:
rp∂rl(r,p)=∂pl(r,p)=0p= N ∑ i = 1 k i∂rl(r,p)∂pl(r,p)=∑i=1Nψ(ki+r)−Nψ(r)+Nln(1−p),=∑i=1Nki1p−Nr11−p.
∂rl(r,p)=∂pl(r,p)=0p=∑i=1Nki(Nr+∑Ni=1ki),∂rl(r,p)=∑i=1Nψ(ki+r)−Nψ(r)+Nln(rr+∑Ni=1kiN) =0.
Phương trình này không thể được giải cho r ở dạng đóng bằng Newton hoặc thậm chí EM. Tuy nhiên, đây không phải là trường hợp trong tình huống này. Mặc dù chúng tôi
có thể sử dụng dữ liệu trong quá khứ để có được một và nhưng điều này thực sự không được sử dụng như quy trình của chúng tôi, chúng tôi cần điều chỉnh các tham số này kịp thời, giống như chúng tôi đã sử dụng Poisson.
rp