Xem xét bất kỳ gia đình quy mô địa điểm nào được xác định bởi phân phối "tiêu chuẩn" ,F
ΩF={F(μ,σ):x→F(x−μσ)∣σ>0}.
Giả sử khác biệt, chúng ta dễ dàng thấy rằng các tệp PDF là 1F.1σf((x−μ)/σ)dx
Cắt bỏ những phân phối để hạn chế sự ủng hộ của họ giữa và b , một < b , phương tiện mà các file PDF được thay thế bằngaba<b
f(μ,σ;a,b)(x)=f(x−μσ)dxσC(μ,σ,a,b),a≤x≤b
(và không cho tất cả các giá trị khác của ), nơi C ( μ , σ , một , b ) = F ( μ , σ ) ( b ) - F ( μ , σ ) ( một ) là yếu tố bình thường cần thiết để đảm bảo rằng f ( μ , σ ; a , b ) tích hợp vào sự thống nhất. (Lưu ý rằng C giống hệt 1xC(μ,σ,a,b)=F(μ,σ)(b)−F(μ,σ)(a)f(μ,σ;a,b)C1trong trường hợp không cắt ngắn.) Do đó khả năng đăng nhập cho dữ liệu iid làxi
Λ(μ,σ)=∑i[logf(xi−μσ)−logσ−logC(μ,σ,a,b)].
Critical points (including any global minima) are found where either σ=0 (a special case I will ignore here) or the gradient vanishes. Using subscripts to denote derivatives, we may formally compute the gradient and write the likelihood equations as
00=∂Λ∂μ=∂Λ∂σ=∑i⎡⎣⎢−fμ(xi−μσ)f(xi−μσ)−Cμ(μ,σ,a,b)C(μ,σ,a,b)⎤⎦⎥=∑i⎡⎣⎢−fσ(xi−μσ)σ2f(xi−μσ)−1σ−Cσ(μ,σ,a,b)C(μ,σ,a,b)⎤⎦⎥
Because a and b are fixed, drop them from the notation and write nCμ(μ,σ,a,b)/C(μ,σ,a,b) as A(μ,σ) and nCσ(μ,σ,a,b)/C(μ,σ,a,b) as B(μ,σ). (With no truncation, both functions would be identically zero.) Separating the terms involving the data from the rest gives
−A(μ,σ)−σ2B(μ,σ)−nσ=∑ifμ(xi−μσ)f(xi−μσ)=∑ifσ(xi−μσ)f(xi−μσ)
By comparing these to the no-truncation situation it is evident that
Any sufficient statistics for the original problem are sufficient for the truncated problem (because the right hand sides have not changed).
Our ability to find closed-form solutions relies on the tractability of A and B. If these do not involve μ and σ in simple ways, we cannot hope to obtain closed-form solutions in general.
For the case of a normal family, C(μ,σ,a,b) of course is given by the cumulative normal PDF, which is a difference of error functions: there is no chance that a closed-form solution can be obtained in general. However, there are only two sufficient statistics (the sample mean and variance will do) and the CDF is as smooth as can be, so numerical solutions will be relatively easy to obtain.