Tôi đang đọc PRML và tôi không hiểu bức tranh. Bạn có thể vui lòng đưa ra một số gợi ý để hiểu bức tranh và tại sao MLE của phương sai trong phân phối Gaussian bị sai lệch?
công thức 1,55: công thức 1.56 σ 2 M L E =1
Tôi đang đọc PRML và tôi không hiểu bức tranh. Bạn có thể vui lòng đưa ra một số gợi ý để hiểu bức tranh và tại sao MLE của phương sai trong phân phối Gaussian bị sai lệch?
công thức 1,55: công thức 1.56 σ 2 M L E =1
Câu trả lời:
Trực giác
Xu hướng là "đến từ" (hoàn toàn không phải là thuật ngữ kỹ thuật) thực tế là được thiên vị cho . Câu hỏi tự nhiên là, "tốt, trực giác tại sao thiên vị cho "? Trực giác là trong một mẫu không bình phương, đôi khi chúng ta bỏ lỡ giá trị thực bằng cách ước tính quá mức và đôi khi bằng cách ước lượng thấp. Nhưng, không bình phương, xu hướng ước tính quá mức và ước tính dưới mức sẽ triệt tiêu lẫn nhau. Tuy nhiên, khi chúng ta bình phương , xu hướng ước tính dưới mức (bỏ lỡ giá trị thực củabởi một số âm) cũng được bình phương và do đó trở nên tích cực. Do đó, nó không còn hủy bỏ và có xu hướng ước tính quá mức.
Nếu trực giác đằng sau lý do tại sao bị sai lệch cho vẫn chưa rõ ràng, hãy thử tìm hiểu trực giác đằng sau sự bất bình đẳng của Jensen (giải thích trực quan tốt ở đây ) và áp dụng nó cho .
Hãy chứng minh rằng MLE của phương sai cho một mẫu iid là sai lệch. Sau đó, chúng tôi sẽ phân tích xác minh trực giác của chúng tôi.
Bằng chứng
Đặt .
Chúng tôi muốn hiển thị .
Sử dụng thực tế là và ,
Với bước cuối cùng tiếp theo do bằng nhau trên do đến từ cùng một phân phối.
Bây giờ, hãy nhớ lại định nghĩa phương sai cho biết . Từ đây, chúng tôi nhận được những điều sau đây
Lưu ý rằng chúng ta đã bình phương một cách thích hợp hằng số khi lấy nó ra khỏi . Đặc biệt chú ý đến điều đó!
đó là, tất nhiên, không bằng để .
Phân tích Xác minh Trực giác của chúng tôi
Chúng ta có thể xác minh phần nào trực giác bằng cách giả sử rằng chúng ta biết giá trị của và cắm nó vào bằng chứng trên. Vì bây giờ chúng tôi biết , chúng tôi không còn cần phải ước tính và do đó chúng tôi không bao giờ ước tính quá mức với . Chúng ta hãy xem điều này "loại bỏ" sự thiên vị trong .
Hãy để .
Từ bằng chứng trên, hãy chọn từ thay thế bằng giá trị thực .ˉ x μ
không thiên vị!