Có thể và đôi khi thích hợp để sử dụng tập hợp con của các thành phần chính làm biến giải thích trong mô hình tuyến tính thay vì các biến ban đầu. Các hệ số kết quả sau đó cần phải được chuyển đổi ngược lại để áp dụng cho các biến ban đầu. Kết quả là sai lệch nhưng có thể vượt trội so với các kỹ thuật đơn giản hơn.
PCA cung cấp một tập hợp các thành phần chính là sự kết hợp tuyến tính của các biến ban đầu. Nếu bạn có biến ban đầu , cuối cùng bạn vẫn có thành phần chính, nhưng chúng đã được xoay qua không gian -dimensional để chúng trực giao với (ví dụ như không tương thích với nhau) (điều này dễ nghĩ nhất chỉ với hai biến). kkk
Mẹo để sử dụng kết quả PCA trong mô hình tuyến tính là bạn đưa ra quyết định loại bỏ một số thành phần chính nhất định. Quyết định này dựa trên các tiêu chí tương tự với các quy trình lựa chọn biến nghệ thuật đen "thông thường" cho các mô hình tòa nhà.
Phương pháp được sử dụng để đối phó với đa cộng tuyến. Nó khá phổ biến trong hồi quy tuyến tính với hàm phản hồi và hàm liên kết nhận dạng bình thường từ bộ dự báo tuyến tính đến đáp ứng; nhưng ít phổ biến hơn với một mô hình tuyến tính tổng quát. Có ít nhất một bài viết về các vấn đề trên web.
Tôi không biết về bất kỳ triển khai phần mềm thân thiện với người dùng nào. Sẽ khá đơn giản để thực hiện PCA và sử dụng các thành phần chính kết quả làm biến giải thích của bạn trong mô hình tuyến tính tổng quát; và sau đó để dịch trở lại quy mô ban đầu. Ước tính phân phối (phương sai, sai lệch và hình dạng) của các công cụ ước tính của bạn đã làm điều này sẽ rất khó khăn; đầu ra tiêu chuẩn từ mô hình tuyến tính tổng quát của bạn sẽ sai vì nó giả định rằng bạn đang xử lý các quan sát ban đầu. Bạn có thể xây dựng một bootstrap xung quanh toàn bộ quy trình (PCA và glm kết hợp), điều này sẽ khả thi trong cả R hoặc SAS.