Làm thế nào để hiểu rằng MLE of Variance bị sai lệch trong phân phối Gaussian?


12

Minh họa PRML về cách thức thiên vị phát sinh trong việc sử dụng khả năng tối đa để xác định phương sai của Gaussian

Tôi đang đọc PRML và tôi không hiểu bức tranh. Bạn có thể vui lòng đưa ra một số gợi ý để hiểu bức tranh và tại sao MLE của phương sai trong phân phối Gaussian bị sai lệch?

công thức 1,55: công thức 1.56 σ 2 M L E =1

μMLE=1Nn=1Nxn
σMLE2=1Nn=1N(xnμMLE)2

Vui lòng thêm thẻ tự học.
StatsStudent 7/2/2015

2
Tại sao với mỗi biểu đồ, chỉ có một điểm dữ liệu màu xanh hiển thị với tôi? btw, trong khi tôi đang cố gắng chỉnh sửa tràn hai mục đăng ký trong bài đăng này, hệ thống yêu cầu "ít nhất 6 ký tự" ... lúng túng.
Zhanxiong 7/2/2015

Những gì bạn thực sự muốn hiểu, hình ảnh hoặc tại sao ước tính phương sai MLE là sai lệch? Cái trước rất khó hiểu nhưng tôi có thể giải thích cái sau.
TrynnaDoStat

vâng, tôi đã tìm thấy trong phiên bản mới, mỗi biểu đồ có hai dữ liệu màu xanh, pdf của tôi đã cũ
ningyuwhut 7/215

@TrynnaDoStat xin lỗi vì câu hỏi của tôi không rõ ràng. điều tôi muốn biết là tại sao ước tính phương sai của MLE bị sai lệch. và làm thế nào điều này được thể hiện trong biểu đồ này
ningyuwhut

Câu trả lời:


24

Trực giác

Xu hướng là "đến từ" (hoàn toàn không phải là thuật ngữ kỹ thuật) thực tế là được thiên vị cho . Câu hỏi tự nhiên là, "tốt, trực giác tại sao thiên vị cho "? Trực giác là trong một mẫu không bình phương, đôi khi chúng ta bỏ lỡ giá trị thực bằng cách ước tính quá mức và đôi khi bằng cách ước lượng thấp. Nhưng, không bình phương, xu hướng ước tính quá mức và ước tính dưới mức sẽ triệt tiêu lẫn nhau. Tuy nhiên, khi chúng ta bình phương , xu hướng ước tính dưới mức (bỏ lỡ giá trị thực củaE[x¯2]μ2E[x¯2]μ2μx¯μbởi một số âm) cũng được bình phương và do đó trở nên tích cực. Do đó, nó không còn hủy bỏ và có xu hướng ước tính quá mức.

Nếu trực giác đằng sau lý do tại sao bị sai lệch cho vẫn chưa rõ ràng, hãy thử tìm hiểu trực giác đằng sau sự bất bình đẳng của Jensen (giải thích trực quan tốt ở đây ) và áp dụng nó cho .x2μ2E[x2]

Hãy chứng minh rằng MLE của phương sai cho một mẫu iid là sai lệch. Sau đó, chúng tôi sẽ phân tích xác minh trực giác của chúng tôi.

Bằng chứng

Đặt .σ^2=1Nn=1N(xnx¯)2

Chúng tôi muốn hiển thị .E[σ^2]σ2

E[σ^2]=E[1Nn=1N(xnx¯)2]=1NE[n=1N(xn22xnx¯+x¯2)]=1NE[n=1Nxn2n=1N2xnx¯+n=1Nx¯2]

Sử dụng thực tế là và ,n=1Nxn=Nx¯n=1Nx¯2=Nx¯2

1NE[n=1Nxn2n=1N2xnx¯+n=1Nx¯2]=1NE[n=1Nxn22Nx¯2+Nx¯2]=1NE[n=1Nxn2Nx¯2]=1NE[n=1Nxn2]E[x¯2]=1Nn=1NE[xn2]E[x¯2]=E[xn2]E[x¯2]

Với bước cuối cùng tiếp theo do bằng nhau trên do đến từ cùng một phân phối.E[xn2]n

Bây giờ, hãy nhớ lại định nghĩa phương sai cho biết . Từ đây, chúng tôi nhận được những điều sau đâyσx2=E[x2]E[x]2

E[xn2]E[x¯2]=σx2+E[xn]2σx¯2E[xn]2=σx2σx¯2=σx2Var(x¯)=σx2Var(1Nn=1Nxn)=σx2(1N)2Var(n=1Nxn)

Lưu ý rằng chúng ta đã bình phương một cách thích hợp hằng số khi lấy nó ra khỏi . Đặc biệt chú ý đến điều đó!1NVar()

σx2(1N)2Var(n=1Nxn)=σx2(1N)2Nσx2=σx21Nσx2=N1Nσx2

đó là, tất nhiên, không bằng để .σx2

Phân tích Xác minh Trực giác của chúng tôi

Chúng ta có thể xác minh phần nào trực giác bằng cách giả sử rằng chúng ta biết giá trị của và cắm nó vào bằng chứng trên. Vì bây giờ chúng tôi biết , chúng tôi không còn cần phải ước tính và do đó chúng tôi không bao giờ ước tính quá mức với . Chúng ta hãy xem điều này "loại bỏ" sự thiên vị trong .μμμ2E[x¯2]σ^2

Hãy để .σ^μ2=1Nn=1N(xnμ)2

Từ bằng chứng trên, hãy chọn từ thay thế bằng giá trị thực .ˉ x μE[xn2]E[x¯2]x¯μ

E[xn2]E[μ2]=E[xn2]μ2=σx2+E[xn]2μ2=σx2

không thiên vị!


3
+1 Có thể đáng lưu ý rằng việc trình diễn của bạn không yêu cầu có phân phối Gaussian. (Tuy nhiên, đối với các phân phối khác, phương sai mẫu có thể không phải là MLE cho tham số phương sai.)X
whuber

1
Cảm ơn lời giải thích của bạn. Tôi cần một chút thời gian để hiểu nó. Bên cạnh đó, tôi đã tìm thấy một số lỗi trong phương trình. Bạn có thể xác minh nó không? Cảm ơn!
ningyuwhut 12/2/2015

@ whuber - Không chắc tại sao bạn lại nói "..demonstration không yêu cầu có phân phối Gaussian.". Chúng tôi sẽ không nói về giải pháp phương sai ML cho mỗi phân phối, giả sử phân phối nhị thức. Vì vậy, mặc nhiên chúng tôi giả sử phân phối X có phương sai là một trong các tham số. X
KGhatak
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.