Làm thế nào để tập trung dữ liệu thoát khỏi sự can thiệp trong hồi quy và PCA?


40

Tôi tiếp tục đọc về các trường hợp chúng tôi tập trung dữ liệu (ví dụ: với chính quy hoặc PCA) để xóa phần chặn (như đã đề cập trong câu hỏi này ). Tôi biết nó đơn giản, nhưng tôi có một thời gian khó hiểu bằng trực giác này. Ai đó có thể cung cấp trực giác hoặc tài liệu tham khảo tôi có thể đọc?


2
Đây là một trường hợp rất đặc biệt về "kiểm soát các biến khác" như được giải thích (theo nhiều cách) tại stats.stackexchange.com/questions/17336/ Lỗi . "Biến" được kiểm soát là thuật ngữ không đổi (chặn).
whuber

Câu trả lời:


66

Những hình ảnh này có thể giúp đỡ?

2 hình ảnh đầu tiên là về hồi quy. Việc định tâm dữ liệu không làm thay đổi độ dốc của đường hồi quy, nhưng nó làm cho việc chặn bằng 0.

nhập mô tả hình ảnh ở đây

Những hình ảnh dưới đây là về PCA. PCA là mô hình hồi quy mà không bị chặn . Vì vậy, các thành phần chính chắc chắn đến thông qua nguồn gốc. Nếu bạn quên tập trung dữ liệu của mình, thành phần chính thứ 1 có thể xuyên qua đám mây không theo hướng chính của đám mây và sẽ (cho mục đích thống kê) gây hiểu lầm.1

nhập mô tả hình ảnh ở đây


1


1
y¯-X¯β

16
PCA is maximizing varianceĐiều này thường không đúng. PCA tối đa hóa (bằng PC thứ 1) độ lệch tổng bình phương so với gốc. Chỉ khi dữ liệu được tập trung sơ bộ (chính nó không phải là một phần của PCA) thì nó mới biến thành tối đa hóa phương sai.
ttnphns

3
PS Lưu ý rằng tính toán hiệp phương sai hoặc tương quan hàm ý định tâm
ttnphns

1
> PS Lưu ý rằng tính toán hiệp phương sai hoặc tương quan hàm ý định tâm - ttnphns 27 tháng 8 '12 lúc 11:47 Trong khi tôi đồng ý với các nhận xét khác của bạn, cả hiệp phương sai và tương quan KHÔNG ngụ ý định tâm. Cả cor và covar đều không thay đổi giá trị khi hằng số phụ gia được áp dụng cho dữ liệu.
TPM

1
Điều này là ngược. Các hằng số phụ gia thực sự không ảnh hưởng đến các mối tương quan, nhưng đó là do chúng bị loại trừ trong các tính toán, như @ttphns chỉ ra. Bỏ qua một bên, đây không phải là một câu trả lời mới, mà là một nhận xét. Chúng tôi hiểu rằng bạn chưa có đủ danh tiếng để bình luận, vì vậy, điều này, tôi tin tưởng, sẽ được di chuyển bởi một người dùng có đủ danh tiếng sau khi tôi gắn cờ.
Nick Cox
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.