Là ước tính không nhất quán bao giờ thích hợp hơn?


22

Tính nhất quán rõ ràng là một công cụ ước tính tài sản tự nhiên và quan trọng, nhưng có những tình huống có thể tốt hơn khi sử dụng một công cụ ước tính không nhất quán thay vì một công cụ nhất quán?

Cụ thể hơn, có những ví dụ về một công cụ ước lượng không nhất quán, vượt trội hơn một công cụ ước tính nhất quán hợp lý cho tất cả hữu hạn (đối với một số hàm mất phù hợp)?n


1
Có một sự đánh đổi thú vị về hiệu suất giữa tính nhất quán của lựa chọn mô hình và tính nhất quán của tham số trong các vấn đề ước tính bằng cách sử dụng Lasso và các biến thể (nhiều!) Của nó. Đây là chi tiết, ví dụ, trong văn bản gần đây của Bühlmann và van der Geer's.
Đức hồng y

Không phải là đối số trong tôi, bây giờ đã bị xóa, câu trả lời vẫn còn? Cụ thể: trong các mẫu nhỏ, tốt hơn là có một công cụ ước lượng không thiên vị với phương sai thấp. Hoặc người ta có thể chỉ ra rằng một công cụ ước tính nhất quán luôn có phương sai thấp hơn bất kỳ công cụ ước tính không thiên vị nào khác không?
Bob Jansen

Có lẽ, @Bootvis! Bạn có một ví dụ về một công cụ ước tính không nhất quán với MSE thấp?
MånsT

3
@Bootvis: Nếu bạn tình cờ xem xét các nhận xét mở rộng về câu trả lời cho một câu hỏi gần đây hỏi về tính nhất quán so với tính không thiên vị, bạn sẽ thấy rằng một công cụ ước tính nhất quán có thể có hành vi hoang dã tùy ý cả phương sai và sai lệch (thậm chí, đồng thời!) . Điều đó sẽ loại bỏ tất cả nghi ngờ liên quan đến bình luận của bạn.
Đức hồng y

Tôi nghĩ rằng tôi đã có từ một trong hai cuốn sách nhưng dường như tôi cũng đã sai về điều đó! Ví dụ không nơi nào được tìm thấy. @cardinal: Nghe có vẻ thú vị, sẽ kiểm tra xem
Bob Jansen

Câu trả lời:


25

Câu trả lời này mô tả một vấn đề thực tế trong đó một công cụ ước lượng nhất quán tự nhiên bị chi phối (vượt trội hơn tất cả các giá trị tham số có thể cho tất cả các kích thước mẫu) bởi một công cụ ước tính không nhất quán. Điều này được thúc đẩy bởi ý tưởng rằng tính nhất quán phù hợp nhất với tổn thất bậc hai, do đó, việc sử dụng một tổn thất xuất phát mạnh mẽ từ đó (chẳng hạn như tổn thất không đối xứng) sẽ làm cho tính nhất quán gần như vô dụng trong việc đánh giá hiệu suất của các công cụ ước tính.


Giả mong muốn khách hàng của bạn để ước tính giá trị trung bình của một biến (giả định là có một phân phối đối xứng) từ một mẫu iid , nhưng họ không thích hoặc là (a) đánh giá thấp nó hay (b) hiển nhiên đánh giá quá cao nó(x1,,xn)

Để xem làm thế nào điều này có thể giải quyết, chúng ta hãy áp dụng một hàm mất đơn giản, hiểu rằng trong thực tế, tổn thất có thể khác với hàm này một cách định lượng (nhưng không định tính). Chọn các đơn vị đo lường sao cho là giá trị ước lượng lớn nhất có thể chấp nhận được và đặt mức mất ước tính t khi giá trị trung bình thực là μ bằng 0 bất cứ khi nào μ t μ + 1 và bằng 1 nếu không.1tμ0μtμ+11

Các tính toán đặc biệt đơn giản cho một gia đình bình thường của các bản phân phối với trung bình và phương sai σ 2 > 0 , cho sau đó giá trị trung bình mẫu ˉ x = 1μσ2>0có bình thường(μ,σ2/n)phân phối. Giá trị trung bình mẫu là một ước lượng nhất quán củaμ, như được biết đến (và rõ ràng). ViếtΦcho CDF bình thường tiêu chuẩn, sự mất mát dự kiến giá trị trung bình mẫu bằng1/2+Φ(-x¯= =1nΣtôixtôi(μ,σ2/n)μΦ:1/2xuất phát từ 50% cơ hội mà giá trị trung bình mẫu sẽ đánh giá thấp giá trị trung bình trung thực vàΦ(-1/2+Φ(n/σ)1/2xuất phát từ khả năng đánh giá quá cao giá trị trung bình đúng hơn1.Φ(n/σ)1

Lỗ vốn

Sự mất mát dự kiến của bằng với diện tích màu xanh dưới PDF bình thường tiêu chuẩn này. Vùng màu đỏ cho thấy sự mất mát dự kiến ​​của công cụ ước tính thay thế, bên dưới. Chúng khác nhau bằng cách thay thế các khu vực màu xanh rắn giữa - x¯0bởi vùng màu đỏ nhỏ hơn nằm giữan/(2σ)0n/(2σ). Sự khác biệt đó tăng lên khintăng.n/σn

x¯+1/22Φ(n/(2σ))1/20nnμ+1/2μ

Mất chức năng

x¯x¯+1/2n


2
L2L2

5
@Macro Suy nghĩ có phần gián tiếp và không có ý định khắt khe nhưng tôi tin đó là điều tự nhiên: mất phương trình bậc hai ngụ ý giảm thiểu phương sai mà (thông qua Ch Quashev) dẫn đến khả năng hội tụ. Vì vậy, một heuristic để tìm một ví dụ mẫu nên tập trung vào các tổn thất cách xa bậc hai mà các thao tác như vậy không thành công.
whuber

1
1/20n

3
@Michael OK, cảm ơn bạn đã giải thích điều đó. Trong bối cảnh này, với một tổn thất không bậc hai, một "lợi thế" không được biểu thị theo các điều khoản sai lệch. Người ta có thể chỉ trích chức năng mất này, nhưng tôi không muốn từ chối nó hoàn toàn: nó mô hình các tình huống trong đó, ví dụ, dữ liệu là các phép đo của một vật phẩm được sản xuất theo dung sai nhất định và nó sẽ là thảm họa (như trong thất bại o-ring của Shuttle hoặc thảm họa kinh doanh phá sản) cho ý nghĩa thực sự nằm ngoài những dung sai đó.
whuber

1
(+1) Câu trả lời tuyệt vời, @whuber! Tôi đặc biệt thích nó không cảm thấy quá bệnh hoạn - tôi có thể nghĩ về nhiều tình huống mà loại mất mát này sẽ được áp dụng.
MånsT
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.