Đây là một đoạn trích hay từ Jolliffe (1982) mà tôi đã không đưa vào câu trả lời trước của mình cho câu hỏi tương tự, " Các thành phần phương sai thấp trong PCA, chúng có thực sự chỉ là tiếng ồn không? Có cách nào để kiểm tra không? " nó khá trực quan.
Giả sử rằng cần phải dự đoán chiều cao của nền tảng đám mây, , một vấn đề quan trọng tại các sân bay. Các biến khí hậu khác nhau được đo bao gồm nhiệt độ bề mặt T s và điểm sương bề mặt, T d . Ở đây, T d là nhiệt độ mà không khí bề mặt sẽ được bão hòa với hơi nước và sự khác biệt T s - T d , là thước đo độ ẩm bề mặt. Bây giờ T s , s + T d và thành phần có phương sai thấp tương quan tương tự với T s - T d . NhưngHTsTdTdTs−Td thường có mối tương quan dương, do đó, phân tích thành phần chính của các biến khí hậu sẽ có thành phần phương sai cao có tương quan cao với TTs,TdTs+TdTs−Td có liên quan đến độ ẩm và do đó để T s - T d , tức là đến một sai thấp hơn là một thành phần sai cao, do đó, một chiến lược mà bác bỏ các thành phần sai thấp sẽ cung cấp cho dự đoán nghèo cho H .HTs−TdH
Việc thảo luận về ví dụ này nhất thiết là mơ hồ vì những tác động chưa biết của bất kỳ biến khí hậu nào khác cũng được đo lường và đưa vào phân tích. Tuy nhiên, nó cho thấy một trường hợp hợp lý về mặt vật lý trong đó một biến phụ thuộc sẽ liên quan đến thành phần phương sai thấp, xác nhận ba ví dụ thực nghiệm từ tài liệu.
Hơn nữa, ví dụ cơ sở đám mây đã được thử nghiệm trên dữ liệu từ Sân bay Cardiff (Wales) trong giai đoạn 1966, 73 với một biến khí hậu bổ sung, nhiệt độ mặt nước biển, cũng được đưa vào. Kết quả về cơ bản như dự đoán ở trên. Thành phần chính cuối cùng là khoảng
và nó chỉ chiếm 0 · 4 phần trăm của tổng biến thể. Tuy nhiên, trong hồi quy thành phần chính, nó dễ dàng là yếu tố dự báo quan trọng nhất đối với HTs−TdH . [Nhấn mạnh thêm]
Ba ví dụ từ văn học được đề cập trong câu cuối cùng của đoạn thứ hai là ba ví dụ tôi đã đề cập trong câu trả lời của mình cho câu hỏi được liên kết .
Tham khảo
Jolliffe, IT (1982). Lưu ý về việc sử dụng các thành phần chính trong hồi quy. Thống kê áp dụng, 31 (3), 300 trận303. Lấy từ http://automatica.dei.unipd.it/public/Schenato/PSC/2010_2011/gruppo4-Building_termo_identification/IdentificazioneTermodinamica20072008/Biblio/Articoli/PCR%20vecchio%2082.pdf .