Tôi tin rằng sự nhầm lẫn có thể phát sinh từ một cái gì đó đơn giản hơn một chút, nhưng nó cung cấp một cơ hội tốt để xem xét một số vấn đề liên quan.
Lưu ý rằng văn bản không cho rằng tất cả các hệ số hồi quy có thể được tính thông qua các vectơ dư liên tiếp là
nhưng đúng hơn chỉ người cuối cùng , , có thể được tính theo cách này!β^i
β^i=?⟨y,zi⟩∥zi∥2,
β^p
Lược đồ trực giao hóa liên tiếp (một dạng của trực giao trực giao Gram, Schmidt) là (gần như) tạo ra một cặp ma trận và sao cho
trong đó là với các cột trực giao và là tam giác trên. Tôi nói "gần như" vì thuật toán chỉ xác định theo định mức của các cột, nói chung sẽ không phải là một, nhưng có thể được thực hiện để có định mức đơn vị bằng cách chuẩn hóa các cột và điều chỉnh đơn giản tương ứng với tọa độ ma trận .ZX = Z GGZ n × p G = ( g i j ) p × p
X=ZG,
Zn×pG=(gij)p×pGZG
Tất nhiên, giả sử rằng có thứ hạng , giải pháp bình phương tối thiểu duy nhất là vectơ giải quyết hệ thống
p ≤ n β X T XX∈Rn×pp≤nβ^
XTXβ^=XTy.
Thay thế và sử dụng (bằng cách xây dựng), chúng tôi nhận được
tương đương với
Z T Z = Tôi G T G βX=ZGZTZ=IG
GTGβ^=GTZTy,
Gβ^=ZTy.
Bây giờ, tập trung vào hàng cuối cùng của hệ thống tuyến tính. Phần tử khác không duy nhất của ở hàng cuối cùng là . Vì vậy, chúng tôi nhận được
Không khó để thấy (xác minh đây là kiểm tra sự hiểu biết!) Màvà vì vậy điều này mang lại giải pháp. ( Nên biết trước đọc có : Tôi đã sử dụng đã bình thường hóa có mức đơn vị, trong khi đó trong cuốn sách họ có không .. Này tài khoản cho một thực tế rằng cuốn sách có một chuẩn mực bình trong mẫu số, trong khi tôi chỉ có tiêu chuẩn)g p p g p p β p =Ggppg p p = ‖ z p ‖ z i
gppβ^p=⟨y,zp⟩.
gpp=∥zp∥zi
Để tìm tất cả các hệ số hồi quy, người ta cần thực hiện một bước hỗ trợ đơn giản để giải quyết cho cá nhân . Ví dụ: đối với hàng ,
và vì vậy
Người ta có thể tiếp tục quy trình này hoạt động "ngược" từ hàng cuối cùng của hệ thống cho đến lần đầu tiên, trừ đi các khoản tiền có trọng số của các hệ số hồi quy đã được tính toán và sau đó chia cho thuật ngữ hàng đầu để lấy .β^i(p−1)
gp−1,p−1β^p−1+gp−1,pβ^p=⟨zp−1,y⟩,
β^p−1=g−1p−1,p−1⟨zp−1,y⟩−g−1p−1,p−1gp−1,pβ^p.
giiβ^i
Điểm trong phần trong ESL là chúng ta có thể sắp xếp lại các cột của để có ma trận mới với cột ban đầu thứ hiện là cột cuối cùng. Sau đó, nếu chúng ta áp dụng quy trình Gram kèm Schmidt trên ma trận mới, chúng ta sẽ có được tính trực giao mới sao cho giải pháp cho hệ số gốc được tìm thấy bằng giải pháp đơn giản ở trên. Điều này cho chúng ta một giải thích cho hệ số hồi quy . Đó là một hồi quy đơn biến của trên vectơ dư thu được bằng cách "hồi quy" các cột còn lại của ma trận thiết kế từ .XX(r)rβ^rβ^ryxr
Phân tách QR chung
Thủ tục Gram-Schmidt, nhưng là một phương pháp tạo ra một phân hủy QR của . Thật vậy, có nhiều lý do để thích các cách tiếp cận thuật toán khác hơn so với quy trình Gram bồi Schmidt.X
Phản xạ của chủ nhà và xoay Givens cung cấp các cách tiếp cận ổn định hơn về mặt số cho vấn đề này. Lưu ý rằng sự phát triển trên không thay đổi trong trường hợp chung về phân tách QR. Cụ thể, chúng ta hãy
có bất kỳ phân hủy QR của . Sau đó, bằng cách sử dụng chính xác các thao tác lý luận và đại số như trên, chúng ta có giải pháp bình phương nhỏ nhất thỏa mãn
giúp đơn giản hóa thành
Vì là tam giác trên, nên kỹ thuật backsubstlation tương tự hoạt động. Trước tiên chúng tôi giải quyết cho
X=QR,
Xβ^RTRβ^=RTQTy,
Rβ^=QTy.
Rβ^pvà sau đó làm việc theo cách của chúng tôi ngược từ dưới lên trên. Sự lựa chọn
mà thuật toán phân rã QR sử dụng thường xoay quanh việc kiểm soát sự không ổn định về số lượng và, từ quan điểm này, GramTHER Schmidt nói chung không phải là một cách tiếp cận cạnh tranh.
Khái niệm phân tách như một ma trận trực giao nhân một thứ khác có thể được khái quát thêm một chút nữa để có được một hình thức rất chung cho vectơ được trang bị , nhưng tôi sợ phản hồi này đã trở nên quá dài .yXy^