Mối quan hệ giữa MLE và bình phương nhỏ nhất trong trường hợp hồi quy tuyến tính


9

Hastie và Tibshirani đề cập đến trong phần 4.3.2 của cuốn sách của họ rằng trong cài đặt hồi quy tuyến tính, phương pháp bình phương nhỏ nhất trên thực tế là một trường hợp đặc biệt có khả năng tối đa. Làm thế nào chúng ta có thể chứng minh kết quả này?

PS: Phụ tùng không có chi tiết toán học.


2
Đây không phải là trường hợp đặc biệt: chúng chỉ giống hệt nhau khi phân phối lỗi là bình thường.
Zhanxiong

Câu trả lời:


13

Mô hình hồi quy tuyến tính

, nơi ε ~ N ( 0 , tôi σ 2 )Y=Xβ+ϵϵN(0,Iσ2)

, X R n × p beta R pYRnXRn×pβRp

ϵ=YXββL2

Bình phương nhỏ nhất

(x1,y1),...,(xn,yn)xip

β^LS=argminβ||ϵ||2=argminβ||YXβ||2=argminβi=1n(yixiβ)2

Khả năng tối đa

β

L(Y|X,β)=i=1nf(yi|xi,β)

f(yi|xi,β)σ2

L(Y|X,β)=i=1n12πσ2e(yixiβ)22σ2

Bây giờ nói chung khi xử lý các khả năng dễ dàng hơn để lấy nhật ký trước khi tiếp tục (các sản phẩm trở thành tổng, số mũ biến mất), vì vậy hãy làm điều đó.

logL(Y|X,β)=i=1nlog(12πσ2)(yixiβ)22σ2

ββ

β^MLE=argmaxβi=1n(yixiβ)22σ2

β

β^MLE=argminβi=1n(yixiβ)2=β^LS

Hãy nhớ lại rằng để điều này hoạt động, chúng ta phải đưa ra một số giả định mô hình nhất định (tính quy tắc của các thuật ngữ lỗi, 0 trung bình, phương sai không đổi). Điều này làm cho bình phương tối thiểu tương đương với MLE trong các điều kiện nhất định. Xem ở đâyở đây để thảo luận thêm.

Để đầy đủ, lưu ý rằng giải pháp có thể được viết là:

β=(XTX)1XTy
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.