Có một ví dụ trong đó MLE đưa ra ước tính sai lệch về giá trị trung bình không?


17

Bạn có thể cung cấp một ví dụ về công cụ ước tính MLE về giá trị trung bình bị sai lệch không?

Tôi không tìm kiếm một ví dụ phá vỡ các công cụ ước tính MLE nói chung bằng cách vi phạm các điều kiện thường xuyên.

Tất cả các ví dụ tôi có thể thấy trên internet đều đề cập đến phương sai và dường như tôi không thể tìm thấy bất cứ điều gì liên quan đến giá trị trung bình.

BIÊN TẬP

@MichaelHardy đã cung cấp một ví dụ trong đó chúng tôi có được ước tính sai lệch về giá trị trung bình của phân phối đồng đều bằng MLE theo một mô hình được đề xuất nhất định.

Tuy nhiên

https://en.wikipedia.org/wiki/Uniform_distribution_(continupt)#Estimation_of_midpoint

gợi ý rằng MLE là một ước lượng không thiên vị tối thiểu thống nhất của giá trị trung bình, rõ ràng theo một mô hình đề xuất khác.

Tại thời điểm này, tôi vẫn chưa rõ lắm về ước tính của MLE nếu nó là mô hình rất giả thuyết phụ thuộc trái ngược với việc ước tính trung bình mẫu là trung tính mô hình. Cuối cùng, tôi quan tâm đến việc ước tính một cái gì đó về dân số và không thực sự quan tâm đến việc ước tính một tham số của một mô hình giả thuyết.

CHỈNH SỬA 2

Như @ChristophHanck đã chỉ ra mô hình với thông tin bổ sung giới thiệu sai lệch nhưng không quản lý để giảm MSE.

Chúng tôi cũng có kết quả bổ sung:

http://www.maths.manchester.ac.uk/~peterf/CSI_ch4_part1.pdf (p61) http://www.cs.tut.fi/~hehu/SSP/lecture6.pdf (slide 2) http: / /www.stats.ox.ac.uk/~marchini/bs2a/lecture4_4up.pdf (slide 5)

"Nếu một công cụ ước lượng không thiên vị hiệu quả nhất ˆθ của tồn tại (nghĩa là không thiên vị và phương sai của nó bằng CRLB) thì phương pháp ước tính khả năng tối đa sẽ tạo ra nó."

"Hơn nữa, nếu một công cụ ước tính hiệu quả tồn tại, đó là công cụ ước tính ML."

Vì MLE với các tham số mô hình miễn phí là không thiên vị và hiệu quả, theo định nghĩa này có phải là "Công cụ ước tính khả năng tối đa không?

CHỈNH SỬA 3

@AlecosPapadopoulos có một ví dụ với phân phối Half Normal trên diễn đàn toán học.

/math/799954/can-the-maximum-likabilities-estimator-be-unbiased-and-fail-to-achieve-cramer-rao

Nó không neo bất kỳ tham số nào của nó như trong trường hợp thống nhất. Tôi sẽ nói rằng giải quyết nó, mặc dù ông đã không chứng minh sự thiên vị của công cụ ước tính trung bình.


10
Giá trị trung bình của đồng phục trên 0 và theta.
Christoph Hanck

1
Tôi không thể theo dõi sự khác biệt của bạn giữa "ước tính điều gì đó về dân số" và "tham số của mô hình giả thuyết". Trong tất cả các số liệu thống kê tham số, chúng tôi tham số hóa dân số theo một số tham số. Tất nhiên, do đó, chúng tôi có thể gặp phải các vấn đề về lỗi chính tả, nhưng điều đó dường như không liên quan đến vấn đề hiện tại.
Christoph Hanck

5
Ví dụ, một dân số có thể được đặc trưng bởi các tham số / khoảnh khắc của nó, như giá trị trung bình và phương sai (chẳng hạn sẽ đủ cho một dân số bình thường). Và: Tôi không nghĩ rằng mọi người ít nhiều mang tính mô phạm với bạn hơn bất kỳ ai khác trên diễn đàn này.
Christoph Hanck

2
Nếu bạn cảm thấy không hài lòng về độ bóng rõ ràng của việc chuyển đổi giữa "tham số" và "trung bình", hãy để tôi xác định một phân phối không âm nhất định theo nghĩa của nó , với mật độ với sự hỗ trợ của ...1μ [0,2μ]12μ[0,2μ]
Cá bạc

1
Về chỉnh sửa 2 của bạn, nhiều kết quả trong số này được lấy trong các điều kiện đều đặn không thỏa mãn với ví dụ thống nhất được thảo luận trong luồng này, trong đó không gian mẫu phụ thuộc vào tham số.
Christoph Hanck

Câu trả lời:


32

Christoph Hanck đã không đăng chi tiết về ví dụ đề xuất của mình. Tôi hiểu rằng anh ta có nghĩa là phân phối đồng đều trong khoảng dựa trên mẫu iid có kích thước lớn hơnX 1 , Vượt , X n n = 1.[0,θ],X1,,Xnn=1.

Giá trị trung bình là .θ/2

MLE của giá trị trung bình làmax{X1,,Xn}/2.

Đó là sai lệch vì vì vậyE ( tối đa / 2 ) < θ / 2.Pr(max<θ)=1,E(max/2)<θ/2.

PS: Có lẽ chúng ta nên lưu ý rằng các ước lượng không thiên vị tốt nhất của giá trị trung bình là không giá trị trung bình mẫu, mà đúng hơn làGiá trị trung bình của mẫu là công cụ ước tính tệ hại của vì đối với một số mẫu, giá trị trung bình mẫu nhỏ hơn và rõ ràng là không thể đối với nhỏ hơncuối PSn + 1θ/2θ/21

n+12nmax{X1,,Xn}.
θ/2θ/2max/2.12max{X1,,Xn},θ/2max/2.

Tôi nghi ngờ phân phối Pareto là một trường hợp như vậy. Đây là thước đo xác suất: Giá trị mong đợi làMLE của giá trị mong đợi là trong đóα

α(κx)α dxx for x>κ.
nαα1κ.phút=phút{X1,...,Xn}.
nni=1n((logXi)log(min))min
min=min{X1,,Xn}.

Tôi đã không tìm ra giá trị mong đợi của MLE cho trung bình, vì vậy tôi không biết xu hướng của nó là gì.


12
Cagdas, không hợp pháp khi yêu cầu một ví dụ và sau đó phủ nhận rằng bạn sẽ đề xuất một cái gì đó khác! Nó giống như yêu cầu một ví dụ về một loại trái cây không có màu đỏ, được hiển thị một quả việt quất, và sau đó nói rằng nó không được tính vì bạn không thích quả việt quất.
whuber

7
Điều đó không liên quan đến câu hỏi bạn hỏi.
whuber

8
@CagdasOzgenc: MLE có bị sai lệch hay không phụ thuộc vào mô hình. Không có thứ gọi là MLE mà không có mô hình. Và nếu bạn thay đổi mô hình, bạn thay đổi MLE.
Michael Hardy

8
@CagdasOzgenc Đây là một câu hỏi mang tính xã hội: ý nghĩa mẫu là một ước lượng không thiên vị của cái gì? Bạn cần một mô hình để có một tham số được ước tính.
Matthew Drury

9
Giá trị trung bình của mẫu iid là một ước lượng không thiên vị của trung bình dân số, nhưng người ta không thể nói về một ước lượng khả năng tối đa của bất cứ thứ gì mà không có cấu trúc nhiều hơn những gì cần thiết để nói về một ước lượng không thiên vị của một cái gì đó.
Michael Hardy

18

Đây là một ví dụ mà tôi nghĩ rằng một số có thể tìm thấy đáng ngạc nhiên:

Trong hồi quy logistic, đối với bất kỳ cỡ mẫu hữu hạn nào có kết quả không xác định (nghĩa là ), bất kỳ hệ số hồi quy ước tính nào không chỉ bị sai lệch, giá trị trung bình của hệ số hồi quy thực sự không được xác định.0<pi<1

Điều này là do đối với bất kỳ cỡ mẫu hữu hạn nào, có một xác suất dương (mặc dù rất nhỏ nếu số lượng mẫu lớn so với số lượng tham số hồi quy) để có được kết quả phân tách hoàn hảo. Khi điều này xảy ra, các hệ số hồi quy ước tính sẽ là hoặc . Có xác suất dương là hoặc ngụ ý giá trị mong đợi là không xác định.-

Để biết thêm về vấn đề cụ thể này, xem hiệu ứng Hauck-Donner .


1
Điều này khá thông minh. Tôi tự hỏi nếu MLE của các hệ số hồi quy logistic là không có điều kiện thiên vị về sự không phổ biến của hiệu ứng Hauck-Donner?
gung - Phục hồi Monica

3
@gung: Câu trả lời ngắn: bỏ qua hiệu ứng Hauck-Donner, vẫn có xu hướng tăng trong các hệ số hồi quy tuyệt đối (tức là hệ số âm có độ lệch xuống, dương có độ lệch hướng lên). Thật thú vị, dường như có sự thiên vị đối với 0,5 trong xác suất ước tính. Tôi đã bắt đầu viết về nó trên bài đăng này , nhưng không đưa ra kết quả của tôi về sự thiên vị của xác suất ước tính.
Vách đá AB

10

Mặc dù @MichaelHardy đã đưa ra quan điểm, đây là một lập luận chi tiết hơn về lý do tại sao MLE của mức tối đa (và do đó, có nghĩa là , bởi tính bất biến) không phải là không thiên vị, mặc dù nó thuộc một mô hình khác (xem chỉnh sửa bên dưới).θ/2

U[0,θ]y(n)yy(n) fy(n)(x)={n

Fy(n)(x)=Pr{Y1x,,Ynx}=Pr{Y1x}n={0forx<0(xθ)nfor0xθ1forx>θ
E [ Y ( n ) ]
fy(n)(x)={nθ(xθ)n1for0xθ0else
E[Y(n)]=0θxnθ(xθ)n1dx=0θn(xθ)ndx=nn+1θ

EDIT: Thực sự là trường hợp (xem phần thảo luận trong các bình luận) MLE không thiên vị cho giá trị trung bình trong trường hợp cả hai giới hạn dưới và giới hạn đều không xác định. Khi đó, tối thiểu là MLE cho , với (chi tiết bị bỏ qua) giá trị mong đợi trong khi sao cho MLE cho là với giá trị mong đợi b Y ( 1 ) a E ( Y ( 1 ) ) = n a + babY(1)a

E(Y(1))=na+bn+1
E(Y(n))=nb+an+1
(a+b)/2
Y(1)+Y(n)2
E(Y(1)+Y(n)2)=na+b+nb+a2(n+1)=a+b2

EDIT 2: Để giải thích về quan điểm của Henry, đây là một mô phỏng nhỏ cho MSE của các công cụ ước tính của giá trị trung bình, cho thấy rằng trong khi MLE nếu chúng ta không biết giới hạn dưới là 0 thì không thiên vị, các MSE cho hai biến thể là giống hệt nhau , gợi ý rằng công cụ ước tính kết hợp kiến ​​thức về giới hạn dưới làm giảm tính biến thiên.

theta <- 1
mean <- theta/2
reps <- 500000
n <- 5
mse <- bias <- matrix(NA, nrow = reps, ncol = 2)

for (i in 1:reps){
  x <- runif(n, min = 0, max = theta)
  mle.knownlowerbound <- max(x)/2
  mle.unknownlowerbound <- (max(x)+min(x))/2
  mse[i,1] <- (mle.knownlowerbound-mean)^2
  mse[i,2] <- (mle.unknownlowerbound-mean)^2
  bias[i,1] <- mle.knownlowerbound-mean
  bias[i,2] <- mle.unknownlowerbound-mean

}

> colMeans(mse)
[1] 0.01194837 0.01194413

> colMeans(bias)
[1] -0.083464968 -0.000121968

Bởi vì Wikipedia đang đề xuất một mô hình khác để bắt đầu. Đó là nơi tôi bối rối.
Cagdas Ozgenc

Có, nhưng một khi chúng ta điều chỉnh trường hợp đặc biệt được thảo luận ở đây, cụ thể là , chúng ta quay lại ô vuông 1. Trong trường hợp đó, chúng ta không cần tối thiểu mẫu để ước tính nữa, vì chúng ta biết rằng giới hạn dưới là 0, sao cho MLE của trung điểm (= median = mean) đơn giản trở thành một lần nữa. a=0(max+0)/2
Christoph Hanck

2
Tôi chưa tìm ra chi tiết, nhưng MLE trong mô hình đó có thể không thiên vị nếu mức tối thiểu đánh giá thấp giới hạn dưới cùng mức với mức tối đa đánh giá thấp tối đa, sao cho điểm giữa được ước tính không sai lệch.
Christoph Hanck

4
@CagdasOzgenc: không thiên vị không phải là biện pháp duy nhất hoặc thậm chí là quan trọng nhất để tốt hơn . Khi biết chính xác một đầu của hỗ trợ, bạn có thể mất sự cân bằng giữa các lỗi trong việc ước tính giá trị trung bình, nhưng cuối cùng bạn (ví dụ) ước tính tốt hơn về phạm vi
Henry

6
Các ước tính khả năng tối đa không phải lúc nào cũng là "tốt nhất" trong tất cả các tiêu chí cho các cỡ mẫu nhỏ. Vậy thì sao? Họ cũng không giả vờ. Nếu bạn muốn sử dụng một công cụ ước tính khác cho vấn đề của bạn có các thuộc tính tốt hơn theo một số tiêu chí cho kích thước mẫu nằm trong vùng lân cận của cỡ mẫu thực tế của bạn, bạn có thể tự do làm điều đó. Tôi làm như vậy, và những người khác cũng vậy. Không ai tuyên bố rằng việc sử dụng MLE là hợp lý trong mọi tình huống chỉ vì đó là MLE.
jbowman

5

Hoàn thành ở đây thiếu sót trong câu trả lời của tôi tại math.se được tham chiếu bởi OP,

n

fH(x)=2/π1v1/2exp{x22v}E(X)=2/πv1/2μ,Var(X)=(12π)v

Khả năng đăng nhập của mẫu là

L(vx)=nln2/πn2lnv12vi=1nxi2

v

vL(vx)=n2v+12v2i=1nxi2,v^MLE=1ni=1nxi2

vì vậy nó là một phương pháp ước lượng khoảnh khắc. Nó không thiên vị kể từ,

E(v^MLE)=E(X2)=Var(X)+[E(X)])2=(12π)v+2πv=v

Nhưng , công cụ ước tính kết quả cho giá trị trung bình bị sai lệch do bất bình đẳng của Jensen

μ^MLE=2/πv^MLEE(μ^MLE)=2/πE(v^MLE)<2/π[E(v^MLE)]=2/πv=μ

4

Vấn đề nổi tiếng của Neyman Scott có một MLE không nhất quán ở chỗ nó thậm chí không bao giờ hội tụ đúng. Thúc đẩy việc sử dụng khả năng có điều kiện.

(Xi,Yi)N(μi,σ2)μi(Xi+Yi)/2σ2σ^2=i=1n1nsi2si2=(Xiμ^i)2/2+(Yiμ^i)2/2=(XiYi)2/4σ2/4


2
k/n0kn

1
Θnkσ

3

Có vô số ví dụ cho hiện tượng này kể từ khi

  1. Ψ(θ)θθΨ(θ^MLE)
  2. θΨ(θ^MLE)E[Ψ(θ^MLE)]Ψ(E[θ^MLE]);
  3. most transforms Ψ(θ) are expectations of some transform of the data, h(X), at least for exponential families, provided an inverse Laplace transform can be applied to them.
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.