Áp dụng hồi quy sườn cho một hệ phương trình chưa xác định?


9

Khi , bài toán bình phương nhỏ nhất áp dụng giới hạn hình cầu trên giá trị của có thể được viết là cho một hệ thống quá hạn. \ | \ cdot \ | _2 là chỉ tiêu Euclide của một vectơ.y=Xβ+eδβ

min yXβ22s.t.  β22δ2
2

Giải pháp tương ứng cho β được đưa ra bởi

β^=(XTX+λI)1XTy ,
có thể bắt nguồn từ phương pháp số nhân Lagrange ( λ là số nhân):
L(β,λ)=yXβ22+λ(β22δ2)

Tôi hiểu rằng có một thuộc tính

(XTX+λI)1XT=XT(XXT+λI)1 .
Phía bên tay phải giống như nghịch đảo giả của ma trận hồi quy X trong trường hợp không xác định (với tham số chính quy được thêm vào, λ ). Điều này có nghĩa là có thể sử dụng cùng một biểu thức để xấp xỉ β cho trường hợp không xác định? Có một dẫn xuất riêng cho biểu thức tương ứng trong trường hợp không xác định trước, vì ràng buộc hạn chế hình cầu là dư thừa với hàm mục tiêu (định mức tối thiểu của β ):

min. β2s.t. Xβ=y .

Câu trả lời:


12

Bắt đầu với việc xây dựng bài toán hồi quy sườn núi như

minXβy22+λx22

bạn có thể viết vấn đề như

minAβb22

Ở đâu

A=[XλI]

b=[y0].

Ma trận có cột thứ hạng đầy đủ vì một phần. Do đó, bài toán bình phương nhỏ nhất là một giải pháp duy nhấtAλI

β^=(ATA)1ATb

Viết ra điều này theo và , và đơn giản hóa rất nhiều số 0, chúng tôi nhận đượcyXy

β^=(XTX+λI)1XTy

Không có gì trong nguồn gốc này phụ thuộc vào việc có thêm hàng hoặc cột, hoặc thậm chí vào việc có rank đầy đủ. Công thức này do đó được áp dụng cho trường hợp không xác định. XXX

Đó là một thực tế đại số cho ,λ>0

(XTX+λI)1XT=XT(XXT+λI)1

Do đó, chúng tôi cũng có tùy chọn sử dụng

β^=XT(XXT+λI)1y .

Để trả lời các câu hỏi cụ thể của bạn:

  1. Có, cả hai công thức làm việc cho trường hợp không xác định cũng như trường hợp được xác định quá mức. Họ cũng làm việc nếu là ít hơn mức tối thiểu của số hàng và cột của . Phiên bản thứ hai có thể hiệu quả hơn đối với các sự cố không xác định do nhỏ hơn trong trường hợp đó. X X X Trank(X)XXXTXTX

  2. Tôi không biết về bất kỳ dẫn xuất nào của phiên bản thay thế của công thức bắt đầu với một số bài toán bình phương nhỏ nhất được làm ẩm khác và sử dụng các phương trình bình thường. Trong mọi trường hợp, bạn có thể rút ra nó theo cách thẳng tiến bằng cách sử dụng một chút đại số.

Có thể bạn đang nghĩ về vấn đề hồi quy sườn núi ở dạng

minβ22

tùy thuộc vào

Xβy22ϵ.

Tuy nhiên, phiên bản này của bài toán hồi quy sườn núi chỉ đơn giản dẫn đến cùng một vấn đề bình phương nhỏ nhất được làm ẩm .minXβy22+λβ22


2
Đáng lưu ý những gì xảy ra trong giới hạn khi chuyển sang 0 nếu có thứ hạng hàng đầy đủ hoặc xếp hạng cột đầy đủ. Nếu có thứ hạng cột đầy đủ, thì trong giới hạn, bạn sẽ nhận được giả ngẫu nhiên . Tương tự, nếu có thứ hạng hàng đầy đủ, thì trong giới hạn bạn sẽ nhận được giả . Vì vậy, điều này hoạt động như chúng ta mong đợi. X X ( X T X ) - 1 X T X X T ( X X T ) - 1λXX(XTX)1XTXXT(XXT)1
Brian Borchers

Đây là một câu trả lời toàn diện và xuất phát từ các mảng tăng (cộng với đại số mà tôi đã bỏ lỡ) rất thỏa mãn. Tôi đã không nghĩ đến vấn đề hồi quy sườn núi ở dạng bạn đã trình bày ở cuối, nhưng thật thú vị khi thấy rằng nó dẫn đến cùng một hàm mục tiêu. Một lời cảm ơn lớn!
hatmatrix

1
Cảm ơn. Tôi sẽ chèn một phích cắm không biết xấu hổ ở đây- Bạn có thể tìm thấy điều này (và rất nhiều tài liệu liên quan) trong sách giáo khoa về ước tính tham số và các vấn đề nghịch đảo mà tôi đồng tác giả với Rick Aster và Cliff Thurber.
Brian Borchers

1
Tôi cũng nói thêm rằng thực sự tính toán nghịch đảo ma trận này thường không phải là cách tốt nhất để sử dụng công thức này. Tùy thuộc vào kích thước và có thể thưa thớt của bạn có thể là tốt hơn nhiều bằng cách sử dụng một chương trình lặp đi lặp lại hoặc đơn giản là sử dụng Phân tích nhân Cholesky của ma trận . X T X + λ tôiXXTX+λI
Brian Borchers

Cảm ơn lời đề nghị của bạn! Tôi đánh giá cao tài liệu tham khảo cho cuốn sách của bạn vì tôi đã gặp khó khăn khi tìm một cuốn sách trên tài liệu này. Kích thước dữ liệu của chúng tôi thực sự không lớn lắm (chỉ có điều chúng tôi có thể phải áp dụng điều này nhiều lần để phân tách các bộ dữ liệu), do đó có thể có thể sửa đổi ngược lại, nhưng cảm ơn vì các con trỏ bổ sung!
hatmatrix
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.