Tại sao chúng ta cần một người ước tính để được nhất quán?


14

Tôi nghĩ rằng, tôi đã hiểu định nghĩa toán học của một công cụ ước lượng nhất quán. Sửa lỗi cho tôi nếu tôi sai:

Wn là một công cụ ước tính nhất quán choθ ifϵ>0

limnP(|Wnθ|>ϵ)=0,θΘ

Trong đó, là không gian tham số. Nhưng tôi muốn hiểu sự cần thiết của một người ước tính để được nhất quán. Tại sao một công cụ ước tính không nhất quán là xấu? Bạn có thể cho tôi một số ví dụ?Θ

Tôi chấp nhận mô phỏng trong R hoặc python.


3
Một công cụ ước tính không nhất quán không phải lúc nào cũng xấu. Ví dụ như một công cụ ước tính không nhất quán nhưng không thiên vị. Xem bài viết của Wikipedia về Công cụ ước tính nhất quán en.wikipedia.org/wiki/Consistent_estimator , đặc biệt là phần về Xu hướng so với tính nhất quán
compbiostats

Tính nhất quán nói đại khái là một hành vi tiệm cận tối ưu của người ước tính. Chúng tôi chọn một ước mà cách tiếp cận giá trị thực của trong thời gian dài. Vì đây chỉ là sự hội tụ trong xác suất, nên chủ đề này có thể hữu ích: stats.stackexchange.com/questions/134701/ . θ
StubbornAtom

Câu trả lời:


21

Nếu công cụ ước tính không nhất quán, nó sẽ không hội tụ đến giá trị thực trong xác suất . Nói cách khác, luôn có một xác suất rằng công cụ ước tính và giá trị thực của bạn sẽ có sự khác biệt, bất kể bạn có bao nhiêu điểm dữ liệu. Điều này thực sự tồi tệ, bởi vì ngay cả khi bạn thu thập lượng dữ liệu khổng lồ, ước tính của bạn sẽ luôn có xác suất dương là một số ϵ>0 khác với giá trị thực. Thực tế, bạn có thể xem xét tình huống này như thể bạn đang sử dụng công cụ ước tính số lượng sao cho thậm chí khảo sát tất cả dân số, thay vì một mẫu nhỏ của nó, sẽ không giúp bạn.


21

Xét n=10000 quan sát từ phân phối Cauchy tiêu chuẩn, giống như phân phối t của Sinh viên với 1 bậc tự do. Các đuôi của phân phối này đủ nặng mà nó không có ý nghĩa; phân phối được tập trung tại trung vị của nóη=0.

Một chuỗi mẫu có nghĩa là Aj=1ji=1jXikhông nhất quán cho tâm phân phối Cauchy. Nói một cách đơn giản, khó khăn là các quan sát rất cựcXi(tích cực hoặc tiêu cực) xảy ra với mức độ đều đặn đến mức không có cơ hội nào đểAjhội tụ đếnη=0.(Ajkhông chỉ chậm hội tụ, chúng không ' t bao giờ hội tụ. Phân phối củaAjmột lần nữa là tiêu chuẩn Cauchy [bằng chứng].)

Ngược lại, tại bất kỳ một bước trong một quá trình lấy mẫu liên tục, khoảng một nửa trong số các quan sát Xi sẽ nằm ở hai bên của η, do đó trình tự Hj của trung vị mẫu không hội tụ về η.

Sự thiếu hội tụ của Aj và sự hội tụ của Hj được minh họa bằng mô phỏng sau.

set.seed(2019)  # for reproducibility
n = 10000;  x = rt(n, 1);  j = 1:n
a = cumsum(x)/j
h = numeric(n)
for (i in 1:n) {
  h[i] = median(x[1:i])  } 
par(mfrow=c(1,2))
 plot(j,a, type="l", ylim=c(-5,5), lwd=2,
    main="Trace of Sample Mean")
  abline(h=0, col="green2")
  k = j[abs(x)>1000] 
  abline(v=k, col="red", lty="dotted")
 plot(j,h, type="l", ylim=c(-5,5), lwd=2,
     main="Trace of Sample Median")
  abline(h=0, col="green2") 
par(mfrow=c(1,1))

enter image description here

Dưới đây là danh sách các bước mà |Xi|>1000. Bạn có thể thấy tác động của một số quan sát cực đoan này đối với các đường trung bình đang chạy trong ô bên trái (tại các đường chấm màu đỏ dọc).

k = j[abs(x)>1000]
rbind(k, round(x[k]))
   [,1] [,2] [,3]  [,4] [,5]  [,6]   [,7]  [,8]
k   291  898 1293  1602 2547  5472   6079  9158
  -5440 2502 5421 -2231 1635 -2644 -10194 -3137

n=10000ηη,


1
Nitpicking một chút, nhưng mô phỏng của bạn minh họa sự thất bại của mẫu có nghĩa là hội tụ gần như chắc chắn, không có khả năng, đến trung tâm Cauchy (tính nhất quán mạnh so với yếu).
aleshing

9

Một ví dụ thực sự đơn giản về lý do tại sao điều quan trọng là phải nghĩ đến tính nhất quán, mà tôi không nghĩ rằng có đủ sự chú ý, đó là một mô hình quá đơn giản.

Như một ví dụ lý thuyết, giả sử bạn muốn điều chỉnh mô hình hồi quy tuyến tính trên một số dữ liệu, trong đó các hiệu ứng thực sự là phi tuyến tính. Sau đó, dự đoán của bạn không thể nhất quán với giá trị trung bình thực cho tất cả các kết hợp hiệp phương sai, trong khi linh hoạt hơn có thể có thể. Nói cách khác, mô hình đơn giản hóa sẽ có những thiếu sót không thể khắc phục bằng cách sử dụng nhiều dữ liệu hơn.


Điều này không nhất thiết đúng, bởi vì mô hình hồi quy tuyến tính "luôn luôn phù hợp", theo nghĩa là yTôi= =y^Tôi+e^Tôi. bạn có thể lập luận rằng mô hình là tốt, nhưng "sai lầm" thực sự là giả sử phần dư có phân phối bình thường iid.
xác suất

8

@BruceET đã đưa ra một câu trả lời kỹ thuật tuyệt vời, nhưng tôi muốn thêm một điểm về việc giải thích tất cả.

One of the fundamental concepts in statistics is that as our sample size increases, we can reach more precise conclusions about our underlying distribution. You could think of it as the notion that taking lots of samples eliminates the random jitter in the data, so we get a better notion of the underlying structure.

Examples of theorems in this vein are plentiful, but the most well-known is the Law of Large Numbers, asserting that if we have a family of i.i.d. random variables (Xi)iN  and E[X1]<, then

1nk=1nXkE[X]   a.s.

Now, to require an estimator to be consistent is to demand that it also follows this rule: As its job is to estimate an unknown parameter, we would like it to converge to that parameter (read: estimate that parameter arbitrarily well) as our sample size tends to infinity.

The equation

limnP(|Wnθ|>ϵ)=0,ϵ>0 θ Θ

is nothing else but convergence in probability of the random variables Wn towards θ, meaning that in some sense, a larger sample will get us closer and closer to the true value.

Now, if you want, you can look at it conversely: If that condition were to fail, then even with infinite sample size, there would be a "corridor" with positive width [θε,θ+ε] around θ and a nonzero probability that even with arbitrarily large sample size, our estimator will fall outside that corridor. And that would obviously violate the aforementioned idea, so consistency is a very natural condition on estimators to desire and enforce.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.