Mặc dù bạn nói rằng hình học của điều này khá rõ ràng với bạn, tôi nghĩ rằng đó là một ý tưởng tốt để xem xét nó. Tôi đã thực hiện điều này trở lại của một bản phác thảo phong bì:
Subplot bên trái là con số tương tự như trong cuốn sách: xem xét hai yếu tố dự đoán và ; như vectơ, và trải rộng trên một chiếc máy bay trong chiều không gian, và đang được chiếu lên mặt phẳng này dẫn đến việc .x1x2x1x2nyy^
Subplot giữa hiển thị mặt phẳng trong trường hợp khi và không trực giao, nhưng cả hai đều có độ dài đơn vị. Các hệ số hồi quy và có thể thu được bằng phép chiếu không trực giao của lên và : điều đó khá rõ ràng từ hình ảnh. Nhưng điều gì xảy ra khi chúng ta đi theo con đường trực giao?Xx1x2β1β2y^x1x2
Hai vectơ trực giao và từ Thuật toán 3.1 cũng được hiển thị trên hình. Lưu ý rằng mỗi trong số chúng được lấy thông qua một quy trình trực giao hóa Gram-Schmidt riêng biệt (chạy riêng thuật toán 3.1): là phần dư của khi được hồi quy trên ans là phần dư của khi hồi quy trên . Do đó, và trực giao với và và độ dài của chúng nhỏ hơnz1z2z1x1x2z2x2x1z1z2x2x11 . Điều này là rất quan trọng.
Như đã nêu trong sách, hệ số hồi quy có thể được lấy là trong đó biểu thị một vectơ đơn vị theo hướng . Khi tôi chiếu lên trên bản vẽ của tôi, độ dài của hình chiếu (hiển thị trên hình) là người đề cử của phân số này. Để có được giá trị thực tế , người ta cần chia cho chiều dài của nhỏ hơn , tức làβi
βi=zi⋅y∥zi∥2=ezi⋅y∥zi∥,
eziziy^ziβizi1βi sẽ lớn hơn chiều dài của hình chiếu.
Bây giờ hãy xem xét những gì xảy ra trong trường hợp cực đoan của tương quan rất cao (subplot phải). Cả đều có lớn, nhưng cả hai vectơ đều nhỏ bé và các hình chiếu của theo hướng của cũng sẽ rất nhỏ; Đây là tôi nghĩ điều gì cuối cùng làm bạn lo lắng. Tuy nhiên, để có được các giá trị , chúng ta sẽ phải hủy các phép chiếu này bằng độ dài nghịch đảo của , thu được các giá trị chính xác.βiziy^ziβizi
Theo thủ tục Gram-Schmidt, phần dư của X1 hoặc X2 trên các hiệp phương sai khác (trong trường hợp này, chỉ là nhau) loại bỏ một cách hiệu quả phương sai chung giữa chúng (đây có thể là nơi tôi đang hiểu lầm), nhưng chắc chắn làm như vậy sẽ loại bỏ điểm chung yếu tố quản lý để giải thích mối quan hệ với Y?
Nhắc lại: có, "phương sai chung" gần như (nhưng không hoàn toàn) "bị loại bỏ" khỏi phần dư - đó là lý do tại sao các phép chiếu trên và sẽ quá ngắn. Tuy nhiên, quy trình Gram-Schmidt có thể giải thích bằng cách chuẩn hóa theo độ dài của và ; độ dài có liên quan nghịch đảo đến tương quan giữa và , do đó, cuối cùng số dư sẽ được khôi phục.z1z2z1z2x1x2
Cập nhật 1
Sau phần thảo luận với @mpiktas trong các bình luận: phần mô tả ở trên không phải là cách quy trình Gram-Schmidt thường được áp dụng để tính các hệ số hồi quy. Thay vì chạy Thuật toán 3.1 nhiều lần (mỗi lần sắp xếp lại chuỗi dự đoán), người ta có thể thu được tất cả các hệ số hồi quy từ một lần chạy. Điều này được ghi nhận trong Hastie et al. trên trang tiếp theo (trang 55) và là nội dung của Bài tập 3.4. Nhưng như tôi đã hiểu câu hỏi của OP, nó đề cập đến cách tiếp cận nhiều lần chạy (điều đó mang lại các công thức rõ ràng cho ).βi
Cập nhật 2
Trả lời bình luận của OP:
Tôi đang cố gắng hiểu làm thế nào 'sức mạnh giải thích chung' của một tập hợp (phụ) là 'chênh lệch giữa' các ước tính hệ số của các hiệp phương sai đó. Tôi nghĩ rằng lời giải thích nằm ở đâu đó giữa hình minh họa hình học mà bạn đã cung cấp và mpiktas chỉ ra cách các hệ số nên tổng hợp với hệ số hồi quy của hệ số chung
Tôi nghĩ rằng nếu bạn đang cố gắng hiểu làm thế nào "phần chung" của các yếu tố dự đoán được thể hiện trong các hệ số hồi quy, thì bạn không cần phải suy nghĩ gì về Gram-Schmidt. Vâng, nó sẽ được "trải ra" giữa những người dự đoán. Có lẽ một cách hữu ích hơn để suy nghĩ về nó là về mặt chuyển đổi các yếu tố dự đoán với PCA để có được các yếu tố dự đoán trực giao. Trong ví dụ của bạn, sẽ có một thành phần chính đầu tiên lớn với trọng số gần như bằng nhau cho và . Vì vậy, hệ số hồi quy tương ứng sẽ phải được "chia" giữa và theo tỷ lệ bằng nhau. Thành phần chính thứ hai sẽ nhỏ và sẽ gần như trực giao với nó.x1x2x1x2y
Trong câu trả lời của tôi ở trên, tôi giả sử rằng bạn đặc biệt nhầm lẫn về quy trình Gram-Schmidt và công thức kết quả cho về mặt .βizi