Các thành phần chính của Luân Đôn được luân chuyển là gì và các thành phần chính không được bảo vệ của các cơ sở dữ liệu, cho rằng PCA luôn xoay trục tọa độ?


13

Theo tôi hiểu, các thành phần chính có được bằng cách xoay trục tọa độ để căn chỉnh chúng với các phương sai tối đa.

Tuy nhiên, tôi tiếp tục đọc về "các thành phần chính không được bảo vệ" và phần mềm thống kê của tôi (SAS) cung cấp cho tôi các thành phần chính được xoay vòng varimax cũng như các thành phần không được bảo vệ. Ở đây tôi bối rối: khi chúng ta tính toán các thành phần chính, các trục đã được quay; vậy tại sao lại có một vòng quay khác cần thiết? Và "thành phần chính không được bảo vệ" nghĩa là gì?


1
Các câu hỏi chỉ về cách phần mềm hoạt động không đúng chủ đề ở đây, nhưng bạn có thể có một câu hỏi thống kê thực sự được chôn ở đây. Bạn có thể muốn chỉnh sửa câu hỏi của mình để làm rõ vấn đề thống kê cơ bản. Bạn có thể thấy rằng khi bạn hiểu các khái niệm thống kê liên quan, các yếu tố dành riêng cho phần mềm là hiển nhiên hoặc ít nhất là dễ dàng nhận được từ tài liệu.
gung - Phục hồi Monica

1
@gung - Câu hỏi của tôi không phải là về phần mềm. Có thể tôi đã đặt nó sai. Tất cả những gì tôi muốn biết là theo sự hiểu biết của tôi, chúng tôi chỉ có được các thành phần chính khi chúng ta xoay các trục trong dòng phương sai tối đa. Sau đó, thành phần chính không được bảo vệ là gì, một thuật ngữ mà tôi tìm thấy trên các trang khác nhau giải thích về PCA. Vui lòng cho tôi biết nếu câu hỏi của tôi vẫn còn mơ hồ.
Srewashi Lahiri

Nó chắc chắn trông giống như về SAS. Nếu không, tôi sẽ chỉnh sửa Q của bạn để xóa các tham chiếu đến SAS và giải thích lại câu hỏi của bạn bằng thuật ngữ trung lập phần mềm. Bạn cũng có thể quan tâm đến việc đọc chủ đề này .
gung - Phục hồi Monica

Tôi đã đề cập đến SAS vì tôi đang tiến hành phân tích trong phần mềm đó. Ngay cả khi bạn giảm giá từ, bạn chỉ có thể cung cấp cho tôi một lời giải thích cho phiên bản câu hỏi đã chỉnh sửa của tôi. Ngoài ra tôi đã đi qua các chủ đề. Vui lòng sửa tôi nếu tôi sai. Khi chúng ta tính toán các thành phần chính, điều đó có nghĩa là các trục đã được quay. Vì vậy, một ký hiệu varimax khác là không cần thiết. Là vậy sao? Tôi thực sự bối rối về phần này. Rất cám ơn trước
Srewashi Lahiri

2
Srewashi, tôi đã tự do viết lại câu hỏi của bạn một cách đáng kể dựa trên sự làm rõ của bạn trong các bình luận. Tôi nghĩ đó là một câu hỏi hay, +1. Vui lòng kiểm tra xem các chỉnh sửa của tôi phản ánh ý định của bạn! Bạn luôn có thể chỉnh sửa nhiều hơn. Cc đến @gung.
amip nói Phục hồi lại

Câu trả lời:


15

Đây sẽ là một câu trả lời phi kỹ thuật.

Bạn đã đúng: PCA về cơ bản là một vòng quay của trục tọa độ, được chọn sao cho mỗi trục thành công thu được càng nhiều phương sai càng tốt.

Trong một số ngành học (chẳng hạn như tâm lý học), mọi người thích áp dụng PCA để diễn giải các trục kết quả. Tức là họ muốn có thể nói rằng trục chính số 1 (là sự kết hợp tuyến tính nhất định của các biến ban đầu) có một số ý nghĩa cụ thể. Để đoán nghĩa này, họ sẽ nhìn vào các trọng số trong tổ hợp tuyến tính. Tuy nhiên, các trọng lượng này thường lộn xộn và không có ý nghĩa rõ ràng có thể được nhận ra.

Trong những trường hợp này, đôi khi mọi người chọn cách sửa lại một chút với giải pháp PCA vanilla. Họ lấy số lượng nhất định các trục chính (được coi là "quan trọng" bởi một số tiêu chí), và bổ sung xoay chúng, cố gắng để đạt được một số "cấu trúc đơn giản" --- có nghĩa là, kết hợp tuyến tính rằng sẽ dễ dàng hơn để giải thích. Có các thuật toán cụ thể tìm kiếm cấu trúc đơn giản nhất có thể; một trong số chúng được gọi là varimax. Sau khi xoay varimax, các thành phần kế tiếp không còn bắt được nhiều phương sai nhất có thể! Tính năng này của PCA bị phá vỡ bằng cách thực hiện xoay vòng varimax bổ sung (hoặc bất kỳ loại nào khác).

Vì vậy, trước khi áp dụng xoay vòng varimax, bạn có các thành phần chính "không được bảo vệ". Và sau đó, bạn có được các thành phần chính "xoay". Nói cách khác, thuật ngữ này đề cập đến quá trình xử lý hậu quả của kết quả PCA chứ không phải chính vòng quay PCA.


Tất cả điều này là hơi phức tạp bởi thực tế là những gì được xoay là tải và không phải là trục chính như vậy. Tuy nhiên, đối với các chi tiết toán học, tôi giới thiệu bạn (và bất kỳ độc giả quan tâm nào) đến câu trả lời dài của tôi ở đây: PCA có theo sau một vòng quay (chẳng hạn như varimax) vẫn là PCA không?


Tôi chưa bắt gặp một lời giải thích tốt hơn và rõ ràng hơn. Tôi cũng đã đi qua các liên kết khác mà bạn đã cung cấp nhưng tôi vẫn chưa giải mã được nó trong toàn bộ. Nếu tôi hiểu đúng thì các thành phần chính không được bảo vệ đã trực giao và không tương thích. Ở đây tôi có một chút nhầm lẫn - vì PC tương ứng với phương sai tối đa liên tiếp nên sau đó tìm thấy PC đầu tiên, dòng phương sai tối đa thứ hai (PC thứ hai) sẽ ở 90 độ (trực giao) so với đầu tiên và cứ thế ?
Srewashi Lahiri

Điều đó đúng: các thành phần chính "không được bảo vệ" là không tương thích và các trục chính "không được bảo vệ" là trực giao. Và vâng, điều cần thiết là các trục chính liên tiếp là các thành phần trực giao và chính không tương thích với các thành phần trước (người ta có thể chứng minh nó về mặt toán học). Nhân tiện, nếu bạn nghĩ rằng câu trả lời này (hoặc bất kỳ câu trả lời nào khác) giải quyết vấn đề cho bạn, bạn có thể "chấp nhận" nó bằng cách nhấp vào dấu màu xanh bên trái. Khi bạn đạt được 15 danh tiếng, bạn cũng sẽ có thể nâng cao các câu trả lời mà bạn thấy hữu ích (tôi nghĩ hiện tại bạn không thể đưa ra bất kỳ câu trả lời nào).
amip nói phục hồi Monica

+1. what gets rotated are loadings and not principal axes as suchTôi sẽ thêm rằng đây là một khái niệm kỹ thuật. Về mặt lý thuyết, hai loại xoay này là juxtapos điều kiện. Trong PCA, chúng tôi xoay để tìm cơ sở trực giao cụ thể (cơ sở có sơ đồ bậc nhất về giá trị bản địa). Trong varimax, chúng tôi xoay để tìm một cơ sở trực giao cụ thể khác (với cấu trúc có thể thay thế nhất). Chúng tôi có thể làm bất kỳ loại cơ sở trực giao.
ttnphns 14/07/2015

Nếu có thể bạn có thể giải thích nó theo thuật ngữ cư sĩ có nghĩa là máy tính không được bảo vệ?
sai_636

@ sai_636 Để biết các điều khoản của cư sĩ, vui lòng xem thống kê.stackexchange.com/questions/2691 .
amip nói rằng Phục hồi lại
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.