Các công cụ ước tính hiệu quả không thiên vị có chiếm ưu thế ngẫu nhiên so với các công cụ ước tính không thiên vị (trung vị) khác không?


9

Mô tả chung

Công cụ ước tính hiệu quả (có phương sai mẫu bằng với giới hạn Cramérọt Rao) có tối đa hóa xác suất để gần với tham số thực không?θ

Giả sử chúng tôi so sánh sự khác biệt hoặc khác biệt tuyệt đối giữa ước tính và tham số thực

Δ^= =θ^-θ

Việc phân phối cho công cụ ước tính hiệu quả có chiếm ưu thế một cách ngẫu nhiên so với phân phối cho bất kỳ công cụ ước tính không thiên vị nào khác không?Δ^Δ~


Động lực

Tôi đang suy nghĩ về điều này bởi vì Công cụ ước tính câu hỏi là tối ưu trong tất cả các hàm mất mát (đánh giá) hợp lý trong đó chúng ta có thể nói rằng công cụ ước tính tốt nhất không thiên vị đối với một hàm mất lồi cũng không phải là ước lượng tốt nhất đối với hàm mất mát khác (Từ Iosif Pinelis, 2015, Một đặc tính của các công cụ ước tính không thiên vị tốt nhất. Bản in sẵn arXiv arXiv: 1508.07636 ). Sự thống trị ngẫu nhiên để gần với tham số thực sự có vẻ giống với tôi (đó là một điều kiện đủ và một tuyên bố mạnh mẽ hơn).


Biểu thức chính xác hơn

Các câu hỏi ở trên là rộng, ví dụ như loại không thiên vị nào được xem xét và chúng ta có cùng một thước đo khoảng cách cho sự khác biệt tiêu cực và tích cực không?

Hãy xem xét hai trường hợp sau để làm cho câu hỏi bớt rộng hơn:

Phỏng đoán 1: Nếu là một công cụ ước lượng trung bình và không thiên vị hiệu quả. Sau đó, đối với bất kỳ công cụ ước tính trung bình và không thiên vị nào trong đó và θ^θ~

nếu x>0 sau đó P[Δ^x]P[Δ~x]nếu x<0 sau đó P[Δ^x]P[Δ~x]
Δ = θ - θ ~ Δ = ~ θ - θΔ^= =θ^-θΔ~= =θ~-θ

Phỏng đoán 2: Nếu là một công cụ ước tính trung bình không thiên vị hiệu quả. Sau đó, đối với mọi công cụ ước tính không thiên vị và θ^θ~x>0

P[|Δ^|x]P[|Δ~|x]

  • Những phỏng đoán trên có đúng không?
  • Nếu các đề xuất quá mạnh, chúng ta có thể điều chỉnh chúng để làm cho nó hoạt động không?

Thứ hai có liên quan đến cái thứ nhất nhưng bỏ đi sự hạn chế về tính không thiên vị (và sau đó chúng ta cần kết hợp cả hai mặt hoặc nếu không thì mệnh đề te sẽ là sai đối với bất kỳ công cụ ước tính nào có trung vị khác với công cụ ước lượng hiệu quả).


Ví dụ, minh họa:

Hãy xem xét ước tính trung bình của phân bố dân số (được giả định là phân phối bình thường) theo (1) trung vị mẫu và (2) trung bình mẫu.μ

Trong trường hợp mẫu có kích thước 5 và khi phân bố dân số thực sự là thì điều này trông giống nhưN(0,1)

ví dụ cdf

Trong hình ảnh, chúng ta thấy rằng CDF gấp của giá trị trung bình mẫu (là công cụ ước tính hiệu quả cho ) nằm dưới CDF gấp của trung vị mẫu. Câu hỏi đặt ra là liệu CDF gấp của trung bình mẫu có nằm dưới CDF gấp của bất kỳ công cụ ước tính không thiên vị nào khác không.μ

Ngoài ra, bằng cách sử dụng CDF thay vì CDF gấp, chúng ta có thể đặt câu hỏi liệu CDF của giá trị trung bình có tối đa hóa khoảng cách từ 0,5 tại mọi điểm không. Chúng tôi biết rằng

θ^:|Fmemộtn(θ^)-0,5||FmedTôimộtn(θ^)-0,5|

chúng ta cũng có điều này khi chúng ta thay thế để phân phối bất kỳ công cụ ước tính trung bình và không thiên vị nào khác?FmedTôimộtn(θ^)


2
Kiểm tra Pitman nearnesstừ khóa, không phải là tôi thấy tiêu chí này đặc biệt hợp lý.
Tây An

1
Từ phỏng đoán, có vẻ hợp lý hơn khi sử dụng các công cụ ước lượng trung bình không thiên vị so với các công cụ ước tính không thiên vị. (Công cụ ước tính không thiên vị tồn tại trong một vài cài đặt và tốt nhất là không thiên vị trong các cài đặt thậm chí ít hơn.)
Xi'an

1
'Tiêu chí gần gũi của Pitman' thực sự thú vị. Dựa trên thông tin trên wikipedia tôi thấy đó là "xác suất cho sự khác biệt tuyệt đối gần hơn". Nó là một chút khác nhau mặc dù. Tiêu chí gần gũi của Pitman này có thể tạo ra các trường hợp thú vị khi một số người ước tính có trung bình chênh lệch tuyệt đối nhỏ hơn nhưng không giành chiến thắng theo tiêu chí gần gũi này.
Sextus Empiricus

1
θ^θ~θθ~θθ

1
@ Xi'an Tôi đã thêm một ví dụ trực quan và bây giờ tôi nhận được nhận xét của bạn về độ lệch trung bình so với độ lệch trung bình. Tôi đã điều chỉnh câu hỏi (mặc dù nó đang chuyển hướng khỏi ý tưởng ban đầu của tôi liên quan đến câu hỏi được liên kết cần một số điều chỉnh phức tạp hơn bây giờ).
Sextus Empiricus

Câu trả lời:


5

(X1,Giáo dục,XN)C(μ,1)μ

  1. μ^1= =Trung bình(X1,Giáo dục,XN)= =X(N/2)
  2. μ^2= =nghĩa là(X(N/4),Giáo dục,X(3N/4))= =2N(X(N/4)+Giáo dục+X(3N/4))
  3. μ^3= =μMLE
  4. μ^4= =μ^1+2Nμ(μ^1)

μ^3μ^4μ^1μ^2nhập mô tả hình ảnh ở đây

Một đại diện cho sự khác biệt đối với cdf theo kinh nghiệm của MLE làm cho nó rõ ràng hơn:

nhập mô tả hình ảnh ở đây

Đây là mã R tương ứng:

T=1e4
N=11
mlechy=function(x){
  return(optimize(function(theta) -sum(dcauchy(x, 
    location=theta, log=TRUE)),  c(-100,100))$minimum)
}
est=matrix(0,T,4)
for (t in 1:T){
cauc=sort(rcauchy(N))
est[t,1]=median(cauc)
est[t,2]=mean(cauc[4:8])
est[t,3]=mlechy(cauc)
est[t,4]=est[t,1]+(4/N)*sum((cauc-est[t,1])/(1+(cauc-est[t,1])^2))
}

plot(ecdf(est[,1]),col="steelblue",cex=.4,xlim=c(-1,1),main="",ylab="F(x)")
plot(ecdf(est[,2]),add=TRUE,col="sienna",cex=.4)
plot(ecdf(est[,3]),add=TRUE,col="gold",cex=.4)
plot(ecdf(est[,4]),add=TRUE,col="tomato",cex=.4)

1
Không nên đường cong vàng (sự khác biệt của MLE theo kinh nghiệm với chính nó) bằng không trong âm mưu của sự khác biệt.
Sextus Empiricus

Thật tệ, tôi đã thay đổi mã màu: cà chua là sự khác biệt với thứ tư, vàng cho sự khác biệt với Pitman, sienna cho sự khác biệt với giá trị trung bình cắt và màu xanh cho sự khác biệt với trung vị.
Tây An
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.