Nếu bạn có hai công cụ ước tính cạnh tranh vàθ^1θ^2 , hay không
MSE(θ^1)<MSE(θ^2)
nói với bạn rằng
θ 1 là ước lượng tốt hơn phụ thuộc hoàn toàn vào bạn định nghĩa "tốt nhất". Ví dụ, nếu bạn đang so sánh ước lượng không thiên vị và bởi "tốt" có nghĩa là bạn có sai thấp hơn thì, vâng, điều này sẽ có nghĩa là
θ 1 là tốt hơn.
M S Eθ^1θ^1MSElà một tiêu chí phổ biến vì mối liên hệ của nó với Least Squares và khả năng đăng nhập Gaussian, nhưng, giống như nhiều tiêu chí thống kê, người ta nên thận trọng khi sử dụng
MSE một cách mù quáng như một thước đo chất lượng của công cụ ước tính mà không chú ý đến ứng dụng.
Có một số tình huống trong đó việc chọn một công cụ ước tính để giảm thiểu MSE có thể không phải là điều đặc biệt hợp lý để làm. Hai kịch bản xuất hiện trong tâm trí:
Nếu có các ngoại lệ rất lớn trong một tập dữ liệu thì chúng có thể ảnh hưởng mạnh đến MSE và do đó, công cụ ước tính giảm thiểu MSE có thể bị ảnh hưởng mạnh mẽ bởi các ngoại lệ đó. Trong những tình huống như vậy, việc một người ước tính giảm thiểu MSE không thực sự cho bạn biết nhiều vì nếu bạn loại bỏ (các) ngoại lệ, bạn có thể có được ước tính cực kỳ khác nhau. Theo nghĩa đó, MSE không "mạnh" đối với các ngoại lệ. Trong bối cảnh hồi quy, thực tế này là điều thúc đẩy Huber M-Ước tính (mà tôi thảo luận trong câu trả lời này), giúp giảm thiểu chức năng tiêu chí khác nhau (đó là sự pha trộn giữa lỗi bình phương và lỗi tuyệt đối) khi có lỗi kéo dài .
Nếu bạn đang ước tính một tham số giới hạn, việc so sánh có thể không phù hợp vì nó bị phạt hơn và đánh giá thấp khác nhau trong trường hợp đó. Ví dụ: giả sử bạn đang ước tính phương sai, σ 2 . Sau đó, nếu bạn có ý thức đánh giá thấp số lượng của bạn M S E có thể tối đa là σ 4 , trong khi đánh giá quá cao có thể tạo ra M S E rằng vượt xa σ 4 , có lẽ ngay cả bởi một số lượng không giới hạn.MSEσ2MSEσ4MSEσ4
Để làm cho những nhược điểm này rõ ràng hơn, tôi sẽ đưa ra một ví dụ cụ thể về thời điểm, vì những vấn đề này, có thể không phải là thước đo thích hợp cho chất lượng của công cụ ước tính.MSE
Giả sử bạn có mẫu từ phân phối t với ν > 2 độ tự do và chúng tôi đang cố gắng ước tính phương sai, đó là ν / ( ν - 2 ) . Hãy xem xét hai ước lượng cạnh tranh: θ 1 : t h e u n b i một s đ d s một m p l e v một r iX1,...,Xntν>2ν/(ν−2) và θ 2 = 0 , r e g một r d l e s s o f t h e d một t một Rõ ràng M S E ( θ 2 ) = ν 2
θ^1: t h e u n b i a s e d s a m p l e v a r i a n c e
θ^2= 0 , r e g a r d l e s s o f t h e d a t a
và nó là một thực tế là
MSE( θ 1)={ ∞ nếu ν ≤ 4 ν 2M S E ( θ^2) = ν2( ν- 2 )2có thể được bắt nguồn bằng cách sử dụng
thực tế được thảo luận trong chủ đề nàyvà
các thuộc tính củaphân phốit.
Do đó, công cụ ước tính ngây thơ vượt trội hơn về mặtMSEbất kể kích thước mẫu bất cứ khi nàoν<4, điều này khá khó hiểu. Nó cũng vượt trội hơn khi
(2M S E ( θ^1) = { ∞ν2( ν- 2 )2( 2n - 1+ 6n ( ν- 4 ))nếu ν≤ 4nếu ν> 4 .
tM S Eν< 4nhưng điều này chỉ phù hợp với các cỡ mẫu rất nhỏ. Ở trên xảy ra do tính chất dài đuôi của
tphân phối với mức độ nhỏ của tự do, mà làm cho
θ 2xu hướng giá trị rất lớn và
MSEphạt nặng nề cho các đánh giá quá cao, trong khi
θ 1không có vấn đề này.
( 2n - 1+ 6n ( ν- 4 )) >1tθ^2M S Eθ^1
M S EM S Eθ^
S( θ^) = θ^ν/ (ν- 2 )- 1 - nhật ký( θ^ν/ (ν- 2 ))
S( θ^1) = ∞