Câu hỏi về một bằng chứng phương trình bình thường


11

Làm thế nào bạn có thể chứng minh rằng các phương trình bình thường: có một hoặc nhiều giải pháp mà không có sự giả định rằng X là khả nghịch?(XTX)β=XTY

Dự đoán duy nhất của tôi là nó có liên quan đến nghịch đảo tổng quát, nhưng tôi hoàn toàn lạc lối.


1
Bạn đạt được điểm bằng cách đặt câu hỏi gây ra câu trả lời tuyệt vời.
Nikana Reklawyks

Câu trả lời:


14

Một người bị cám dỗ để được glib và chỉ ra rằng bởi vì hình thức bậc hai

β(YXβ)(YXβ)

đang tích cực bán nhất định, tồn tại một mà nó là tối thiểu và tối thiểu được tìm thấy (bằng cách thiết lập gradient đối với β bằng không) với các phương trình bình thườngββ

XX(YXβ)=0,

từ đâu thì phải có ít nhất một giải pháp không phụ thuộc vào thứ hạng của XX . Tuy nhiên, lập luận này dường như không nằm trong tinh thần của câu hỏi, dường như là một tuyên bố đại số thuần túy. Có lẽ thật thú vị khi hiểu tại sao một phương trình như vậy phải có một giải pháp và trong những điều kiện chính xác. Vì vậy, hãy bắt đầu lại và giả vờ rằng chúng ta không biết kết nối với các hình vuông nhỏ nhất.


Tất cả đều đi xuống đến ý nghĩa của , các transpose của X . Điều này sẽ trở thành một vấn đề của một định nghĩa đơn giản, ký hiệu phù hợp và khái niệm về một hình thức Sesquilinear không phổ biến. Hãy nhớ rằng X là "ma trận thiết kế" của n hàng (một cho mỗi quan sát) và cột p (một cho mỗi biến, bao gồm cả hằng số nếu có). Do đó, nó đại diện cho một chuyển đổi tuyến tính từ không gian vectơ V = R p sang W = R n .XXXnpV=RpW=Rn

Các chuyển vị của , coi như là một biến đổi tuyến tính , là một biến đổi tuyến tính của không gian kép X ' : W *V * . Để thực hiện ý nghĩa của một thành phần như X ' X , sau đó, nó là cần thiết để xác định W * với W . Đó là những gì sản phẩm bên trong thông thường (tổng bình phương) trên W làm.X X:WVXXWWW

Thực tế có hai sản phẩm bên trong g W được xác định trên VW tương ứng. Đây là các hàm đối xứng song tuyến có giá trị thực không suy biến . Cái sau có nghĩa làgVgWVW

gW(u,v)=0 uWv=0,

gVg(u,v)=0uvgWgVX:WV

X:VWX:WV

gV(X(w),v)=gW(w,X(v))

wWvVX(w)VVWv1v2gV(v1,v)=gV(v2,v)vVgV(v1v2,v)=0vv1v2=0

UW,UUX(V)X{X(v)|vV}WXX

X(w)=0wX(V).

wXwX

  1. X(w)=0gW(w,X(v))=gV(X(w),v)=gV(0,v)=0vVwX(V)

  2. wX(V)gW(w,X(v))=0vVgV(X(w),v)=0gVX(w)=0

WW=X(V)X(V) yWy=y0+yy0X(V)yX(V)y0X(β)βV

yXβ=(y0+y)y0=yX(V)

X

X(yXβ)=0,

βXXβ=Xy.


nyWy0Xyy0y0pβVX(V)XXVW

VU=X(V)WXU


Một kết quả thú vị của trình diễn đại số trừu tượng này là chúng ta có thể giải các phương trình bình thường trong các không gian vectơ tùy ý. Kết quả cho thấy, đối với các không gian phức tạp, đối với các không gian trên các trường hữu hạn (trong đó tối thiểu hóa một tổng bình phương có ý nghĩa rất nhỏ) và thậm chí trên các không gian vô hạn hỗ trợ các dạng tuần tự phù hợp.


1
Tôi không bao giờ có đại diện để chấp nhận câu trả lời này cho đến sau này. Tôi chỉ vấp ngã về điều này và muốn cảm ơn bạn một lần nữa!
ryati

β(YXβ)(YXβ)
β(YXβ)(YXβ),
f:AB.
Michael Hardy

@Michael Phải có một lỗi đánh máy trong bình luận của bạn. Bạn có phiền làm rõ những gì bạn có ý nghĩa?
whuber

''''
Michael Hardy

@Michael Hãy tha thứ cho tôi vì đã không thấy sự khác biệt đó, mặc dù có nhiều bài đọc. Bất kể, đối với tôi mũi tên đầu tiên đề cập đến chức năng tiêm trong khi mũi tên thứ hai đề cập đến bất kỳ chức năng nào, nhưng tôi nghi ngờ đó không phải là ý bạn. Bạn có phiền giải thích ký hiệu của bạn?
whuber

0

nXTXxxi=xyy¯


X=[1 x1;1 x2;;1 xn]X=[1 x11xm1;;1 x1nxmn]

3
XX

0

Trong hồi quy điển hình, X gầy và do đó chắc chắn không thể đảo ngược (mặc dù nó có thể bị đảo ngược.) Thật đơn giản để chứng minh (hỏi nếu bạn cần trợ giúp) rằng nếu X gầy và không thể đảo ngược thì X ^ T * X không thể đảo ngược. Trong trường hợp này, sau đó sẽ có chính xác một giải pháp. Và nếu X không có thứ hạng cột đầy đủ, thì X ^ T * X sẽ không có thứ hạng đầy đủ và do đó bạn sẽ có một hệ thống chưa được xác định trước.


1
XXX0β=0 β

whuber: tất nhiên họ giải quyết câu hỏi: một soln nếu X là thứ hạng cột đầy đủ (như tôi đã đề cập) và các giải pháp vô hạn nếu đó là một hệ thống không xác định
user542833

1
Thực tế là hệ thống "không xác định trước" không có nghĩa là nó có bất kỳ giải pháp nào cả. Câu hỏi là về sự tồn tại của các giải pháp.
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.