Nếu bạn thực sự có nghĩa là khả năng đăng nhập , thì câu trả lời là: không phải lúc nào cũng bằng không.
Ví dụ, hãy xem xét dữ liệu Poisson: yi∼Poisson(μi),i=1,…,n . Các loga cho Y=(y1,…,yn) được cho bởi:
ℓ(μ;Y)=−∑i=1nμi+∑i=1nyilogμi−∑i=1nlog(yi!).(∗)
Phân biệt ℓ(μ;Y) trong (∗) liên quan đến μi và đặt nó là 0 (đây là cách chúng tôi có được MLE cho mô hình bão hòa):
−1+yiμi=0.
Giải quyết này cho
μiđể có được
μ i=yi, thay
μ itrở lại
(*)cho
μicho rằng loga của mô hình bão hòa là:
ℓ( μ ;Y)=n ∑ i=1yi(logyi-1)-n ∑ i=μ^i=yiμ^i(∗)μiℓ(μ^;Y)=∑i=1nyi(logyi−1)−∑i=1nlog(yi!)≠0
trừ khi
yilấy các giá trị rất đặc biệt.
Trong trang trợ giúp của R
chức năng glm
, bên dưới mục deviance
, tài liệu giải thích vấn đề này như sau:
deviance
lên đến một hằng số, trừ hai lần khả năng đăng nhập tối đa. Trong trường hợp hợp lý, hằng số được chọn sao cho mô hình bão hòa có độ lệch bằng không.
Lưu ý rằng nó đã đề cập rằng độ lệch , thay vì khả năng đăng nhập của mô hình bão hòa được chọn là 0.
Có lẽ, điều bạn thực sự muốn xác nhận là "độ lệch của mô hình bão hòa luôn luôn là 0", điều này đúng, theo định nghĩa, theo định nghĩa (xem Phần 4.5.1 của Phân tích dữ liệu phân loại (Ấn bản 2) của Alan Agresti) là thống kê tỷ lệ khả năng của một GLM được chỉ định cho mô hình bão hòa. Những điều đã constant
nói ở trên trong tài liệu R thực sự gấp đôi khả năng đăng nhập tối đa của mô hình bão hòa.
Về tuyên bố của bạn "Tuy nhiên, cách thức đưa ra công thức cho sự lệch lạc cho thấy rằng đôi khi số lượng này không phải là số không.", Có lẽ là do lạm dụng việc sử dụng thuật ngữ sai lệch . Ví dụ, trong R, thống kê tỷ lệ khả năng so sánh hai mô hình tùy ý (lồng nhau) và M 2 cũng được gọi là độ lệch, được gọi chính xác hơn là sự khác biệt giữa độ lệch của M 1 và độ lệch của M 2 , nếu chúng ta theo sát định nghĩa như được đưa ra trong cuốn sách của Agresti.M1M2M1M2
Phần kết luận
Khả năng đăng nhập của mô hình bão hòa nói chung là khác không.
Độ lệch (theo định nghĩa ban đầu của nó) của mô hình bão hòa là bằng không.
Đầu ra sai lệch từ các phần mềm (như R) nói chung là khác không vì nó thực sự có nghĩa là một cái gì đó khác (sự khác biệt giữa các độ lệch).
Sau đây là đạo hàm cho trường hợp gia đình hàm mũ và một ví dụ cụ thể khác. Giả sử rằng dữ liệu đến từ gia đình mũ (xem Modern Thống Kê Ứng Dụng với S , Chương ):
f ( y i ; θ i , φ ) = exp [ Một i ( y i θ i - γ ( θ i ) ) / φ + τ ( y i , φ / A i ) ] .7
f(yi;θi,φ)=exp[Ai(yiθi−γ(θi))/φ+τ(yi,φ/Ai)].(1)
Trong đó
được biết các trọng số trước và
φ là tham số phân tán / tỷ lệ (đối với nhiều trường hợp như nhị thức và Poisson, tham số này được biết đến, trong khi đối với các trường hợp khác như bình thường và Gamma, tham số này không xác định). Sau đó, loga được cho bởi:
ℓ ( θ , φ ; Y ) = n Σ i = 1 A i ( y i θ i - γ ( θ i ) ) / φ + n Σ i = 1 τAiφ
Như trong ví dụ Poisson, các tham số của mô hình bão hòa có thể được ước tính bằng cách giảihàm
số điểmsau:
0 = U ( θ i ) = ∂ ℓ ( θ , φ ; Y )ℓ(θ,φ;Y)=∑i=1nAi(yiθi−γ(θi))/φ+∑i=1nτ(yi,φ/Ai).
0=U(θi)=∂ℓ(θ,φ;Y)∂θi=Ai(yi−γ′(θi))φ
θ^i
ℓ(θ^,φ;Y)=∑i=1nAi(yiθ^i−γ(θ^i))/φ+∑i=1nτ(yi,φ/Ai).(∗∗)
(∗∗)Γ(α,β)
f(y;α,β)=βαΓ(α)e−βyyα−1,y>0,α>0,β>0,
f(1)φ=1α,θ=−βα,
ff( y; θ , φ ) = exp[ θ y- ( - nhật ký( - θ ) )φ+ τ( y, φ ) ] ,
τ( y, Φ ) = - logφφ+ ( 1φ- 1 ) nhật kýy- đăng nhậpΓ ( φ- 1) .
θ^Tôi= - 1yTôiΣi = 1n1φ[ θ^TôiyTôi- ( - nhật ký( - θ^Tôi) ) ] = Σi = 1n1φ[−1−log(yi)]≠0,
yi