Một cách để kiểm tra tính ngẫu nhiên của một thành phần chính nhỏ (PC) là coi nó như một tín hiệu thay vì nhiễu: tức là cố gắng dự đoán một biến quan tâm khác với nó. Đây thực chất là hồi quy thành phần chính (PCR) .
R2MSE
- Một mô hình kỹ thuật hóa học sử dụng PC 1, 3, 4, 6, 7 và 8 trên tổng số 9 ( Smith & Campbell, 1980 )
- Một mô hình gió mùa sử dụng PC 8, 2 và 10 (theo thứ tự quan trọng) trong số 10 ( Kung & Sharif, 1980 )
- Một mô hình kinh tế sử dụng PC 4 và 5 trên 6 (Hill, Fomby, & Johnson, 1977)
Các PC trong các ví dụ được liệt kê ở trên được đánh số theo kích thước được xếp hạng riêng của chúng. Jolliffe (1982) mô tả một mô hình đám mây trong đó thành phần cuối cùng đóng góp nhiều nhất. Ông kết luận:
Các ví dụ trên đã chỉ ra rằng không cần thiết phải tìm dữ liệu tối nghĩa hoặc kỳ quái để một vài thành phần chính cuối cùng quan trọng trong hồi quy thành phần chính. Thay vào đó, có vẻ như các ví dụ như vậy có thể khá phổ biến trong thực tế. Hill và cộng sự. (1977) đưa ra một cuộc thảo luận kỹ lưỡng và hữu ích về các chiến lược để lựa chọn các thành phần chính đáng lẽ phải chôn vùi mãi ý tưởng lựa chọn chỉ dựa trên kích thước của phương sai. Thật không may, điều này dường như không xảy ra, và ý tưởng có lẽ phổ biến hơn bây giờ hơn 20 năm trước.
SS
( p - 1 )Y có thể phù hợp hoàn hảo với PC cuối cùng luôn luôn là PC cuối cùng bỏ qua phương pháp PCR.
X . Do đó, nếu sử dụng PCR, nên thận trọng khi sử dụng và lựa chọn các PC để giữ không chỉ bằng cách phân tách phương sai mà còn bởi sự đóng góp của từng thành phần chính vào tổng bình phương hồi quy.
Tôi nợ câu trả lời này cho @Scortchi, người đã sửa chữa những quan niệm sai lầm của riêng tôi về lựa chọn PC trong PCR với một số ý kiến rất hữu ích, bao gồm: " Jolliffe (2010) xem xét các cách khác để chọn PC." Tài liệu tham khảo này có thể là một nơi tốt để tìm kiếm thêm ý tưởng.
Người giới thiệu
- Súng, RF, & Mason, RL (1977). Ước lượng thiên vị trong hồi quy: một đánh giá sử dụng sai số bình phương trung bình. Tạp chí của Hiệp hội Thống kê Hoa Kỳ, 72 (359), 616 Từ628.
- Hadi, AS, & Ling, RF (1998). Một số lưu ý cảnh báo về việc sử dụng hồi quy thành phần chính. Thống kê người Mỹ, 52 (1), 15 trận19. Lấy từ http://www.uvm.edu/~rsingle/stat380/F04/possible/Hadi+Ling-AmStat-1998_PCRegression.pdf .
- Hawkins, DM (1973). Về việc điều tra hồi quy thay thế bằng phân tích thành phần chính. Thống kê áp dụng, 22 (3), 275 Từ286.
- Đồi, RC, Fomby, TB, & Johnson, SR (1977). Định mức lựa chọn thành phần cho hồi quy thành phần chính.Truyền thông trong thống kê - Lý thuyết và phương pháp, 6 (4), 309 Phản34.
- Khách sạn, H. (1957). Mối quan hệ của các phương pháp thống kê đa biến mới hơn để phân tích nhân tố. Tạp chí Tâm lý học Thống kê Anh, 10 (2), 69 bù79.
- Jackson, E. (1991). Hướng dẫn sử dụng cho các thành phần chính . New York: Wiley.
- Jolliffe, CNTT (1982). Lưu ý về việc sử dụng các thành phần chính trong hồi quy. Thống kê áp dụng, 31 (3), 300 trận303. Lấy từ http://automatica.dei.unipd.it/public/Schenato/PSC/2010_2011/gruppo4-Building_termo_identification/IdentificazioneTermodinamica20072008/Biblio/Articoli/PCR%20vecchio%2082.pdf .
- Jolliffe, CNTT (2010).Phân tích thành phần chính (tái bản lần 2). Mùa xuân.
- Kung, EC, & Sharif, TA (1980). Dự báo hồi quy về sự khởi đầu của gió mùa hè Ấn Độ với điều kiện không khí phía trên trước đó. Tạp chí Khí tượng học ứng dụng, 19 (4), 370 Máy 380. Lấy từ http://iri.columbia.edu/~ousmane/print/Onset/ErnestSharif80_JAS.pdf .
- Lott, WF (1973). Tập hợp tối ưu của các hạn chế thành phần chính đối với hồi quy bình phương nhỏ nhất. Truyền thông trong Thống kê - Lý thuyết và Phương pháp, 2 (5), 449 Từ464.
- Mason, RL, & Gunst, RF (1985). Chọn thành phần chính trong hồi quy. Số liệu thống kê và xác suất, 3 (6), 299.
- Khối lượng lớn, WF (1965). Hồi quy thành phần chính trong nghiên cứu thống kê thăm dò. Tạp chí của Hiệp hội Thống kê Hoa Kỳ, 60 (309), 234 Từ256. Lấy từ http://automatica.dei.unipd.it/public/Schenato/PSC/2010_2011/gruppo4-Building_termo_identification/IdentificazioneTermodinamica20072008/Biblio/Articoli/PCR%20vecchio%2065.pdf .
- Smith, G., & Campbell, F. (1980). Một bài phê bình về một số phương pháp hồi quy sườn núi.Tạp chí của Hiệp hội Thống kê Hoa Kỳ, 75 (369), 74 Từ81. Lấy từ https://cowles.econ.yale.edu/P/cp/p04b/p0496.pdf .