Lý do trực quan đằng sau việc thực hiện các phép quay trong Phân tích nhân tố / PCA là gì và làm thế nào để chọn xoay vòng phù hợp?


33

Những câu hỏi của tôi

  1. Lý do trực quan đằng sau việc thực hiện luân chuyển các yếu tố trong phân tích nhân tố (hoặc các thành phần trong PCA) là gì?

    Sự hiểu biết của tôi là, nếu các biến được tải gần như bằng nhau trong các thành phần (hoặc yếu tố) hàng đầu thì rõ ràng rất khó để phân biệt các thành phần. Vì vậy, trong trường hợp này, người ta có thể sử dụng phép quay để phân biệt các thành phần tốt hơn. Điều này có đúng không?

  2. Hậu quả của việc quay là gì? Điều này ảnh hưởng gì?

  3. Làm thế nào để chọn vòng quay phù hợp? Có các phép quay trực giao & phép quay xiên. Làm thế nào để lựa chọn giữa những điều này và ý nghĩa của sự lựa chọn này là gì?

Hãy giải thích bằng trực giác với các phương trình toán học ít nhất. Rất ít câu trả lời dàn trải là toán nặng nhưng tôi đang tìm kiếm nhiều hơn vì lý do trực quan và quy tắc của ngón tay cái.

Câu trả lời:


34
  1. Lý do quay vòng . Xoay được thực hiện để giải thích các yếu tố trích xuất trong phân tích nhân tố (hoặc các thành phần trong PCA, nếu bạn mạo hiểm sử dụng PCA làm kỹ thuật phân tích nhân tố). Bạn đúng khi bạn mô tả sự hiểu biết của bạn. Xoay được thực hiện trong việc theo đuổi một số cấu trúc của ma trận tải, có thể được gọi là cấu trúc đơn giản . Đó là khi các yếu tố khác nhau có xu hướng tải các biến khác nhau1. [Tôi tin rằng sẽ đúng hơn khi nói rằng "một yếu tố tải một biến" so với "một biến tải một yếu tố", bởi vì đó là yếu tố biến "trong" hoặc "phía sau" để làm cho chúng tương quan, nhưng bạn có thể nói như bạn muốn.] Theo một nghĩa nào đó, cấu trúc đơn giản điển hình là nơi "cụm" các biến tương quan xuất hiện. Sau đó, bạn giải thích một yếu tố là ý nghĩa nằm trên giao điểm của ý nghĩa của các biến được tải đủ bởi yếu tố đó; do đó, để nhận được ý nghĩa khác nhau, các yếu tố nên tải các biến khác nhau. Một nguyên tắc nhỏ là một yếu tố nên tải ít nhất 3 biến.

  2. Hậu quả . Xoay không thay đổi vị trí của các biến so với nhau trong không gian của các yếu tố, tức là mối tương quan giữa các biến đang được bảo tồn. Những gì được thay đổi là tọa độ của các điểm cuối của vectơ biến đổi trên các trục yếu tố - các tải trọng (vui lòng tìm kiếm trang web này để "tải lô" và "biplot", để biết thêm) . Sau một vòng quay trực giao của ma trận tải, phương sai các yếu tố được thay đổi, nhưng các yếu tố vẫn không tương quan và các cộng đồng biến đổi được bảo tồn.2

    Trong một yếu tố xoay xiên được phép mất đi sự không tương quan nếu điều đó sẽ tạo ra một "cấu trúc đơn giản" rõ ràng hơn. Tuy nhiên, giải thích các yếu tố tương quan là một nghệ thuật khó khăn hơn vì bạn phải rút ra ý nghĩa từ một yếu tố này để nó không làm ô nhiễm ý nghĩa của một yếu tố khác mà nó tương quan. Điều đó ngụ ý rằng bạn phải giải thích các yếu tố, hãy để chúng tôi nói, song song, và không phải từng người một. Xoay lá xiên bạn với hai ma trận của tải trọng thay vì một: mô hình ma trận và cấu trúc ma trận . ( , trong đó là ma trận tương quan giữa các yếu tố; , trong đóPSS=PCCC=QQQlà ma trận xoay xiên: , trong đó là ma trận tải trước bất kỳ phép quay nào.) Ma trận mẫu là ma trận các trọng số hồi quy theo đó các yếu tố dự đoán các biến, trong khi ma trận cấu trúc là các mối tương quan (hoặc hiệp phương sai) giữa các yếu tố và biến. Hầu hết thời gian chúng tôi giải thích các yếu tố bằng cách tải mẫu bởi vì các hệ số này đại diện cho đầu tư riêng lẻ của yếu tố trong một biến. Xoay xiên bảo communalities biến, nhưng communalities không còn tương đương với số tiền hàng của hình vuông trong hoặc trong . Hơn nữa, vì các yếu tố tương quan, phương sai của chúng một phần chồng chất .S=AQAP S 3PS3

    Tất nhiên, cả hai phép quay trực giao và xiên đều ảnh hưởng đến điểm yếu tố / thành phần mà bạn có thể muốn tính toán (vui lòng tìm kiếm "điểm yếu tố" trên trang web này). Xoay, trong thực tế, cung cấp cho bạn các yếu tố khác ngoài các yếu tố bạn đã có sau khi trích xuất . Họ thừa hưởng sức mạnh dự đoán của họ (cho các biến và tương quan của chúng) nhưng chúng sẽ có ý nghĩa đáng kể khác nhau từ bạn. Sau khi xoay, bạn có thể không nói "yếu tố này quan trọng hơn yếu tố đó" bởi vì chúng được xoay vòng với nhau (thành thật mà nói, trong FA, không giống như PCA, bạn khó có thể nói ngay cả sau khi trích xuất vì các yếu tố được mô hình hóa như đã "quan trọng").4

  3. Lựa chọn . Có nhiều hình thức xoay trực giao và xiên. Tại sao? Đầu tiên, bởi vì khái niệm "cấu trúc đơn giản" không phải là không chính thống và có thể được xây dựng hơi khác nhau. Ví dụ, varimax - phương pháp trực giao phổ biến nhất - cố gắng tối đa hóa phương sai giữa các giá trị bình phương tải của mỗi yếu tố; đôi khi phương pháp trực giao được sử dụng quartimax giảm thiểu số lượng các yếu tố cần thiết để giải thích một biến và thường tạo ra cái gọi là "yếu tố chung". Thứ hai, các vòng quay khác nhau nhắm vào các mục tiêu phụ khác nhau ngoài cấu trúc đơn giản. Tôi sẽ không đi vào chi tiết về những chủ đề phức tạp này, nhưng bạn có thể muốn tự mình đọc về chúng.

    Nên người ta thích xoay trực giao hay xiên? Vâng, các yếu tố trực giao dễ giải thích hơn và toàn bộ mô hình nhân tố đơn giản hơn về mặt thống kê (tất nhiên là các yếu tố dự đoán trực giao). Nhưng ở đó bạn áp đặt tính trực giao lên những đặc điểm tiềm ẩn mà bạn muốn khám phá; Bạn có chắc chắn họ sẽ không bị thất vọng trong lĩnh vực bạn học? Nếu họ không thì sao? Phương pháp xoay xiên 55(mặc dù mỗi người có khuynh hướng riêng) cho phép, nhưng không ép buộc, các yếu tố tương quan, và do đó ít hạn chế hơn. Nếu xoay xiên cho thấy các yếu tố chỉ tương quan yếu, bạn có thể tự tin rằng "trong thực tế" là như vậy, và sau đó bạn có thể chuyển sang xoay trực giao với lương tâm tốt. Nếu yếu tố này, mặt khác, có tương quan rất nhiều, có vẻ không tự nhiên (đối với những đặc điểm tiềm ẩn khái niệm rõ rệt, đặc biệt là nếu bạn đang phát triển một hàng tồn kho trong tâm lý học hoặc tương tự, - nhớ lại rằng một yếu tố chính nó là một đơn biến đặc điểm, không phải là một mẻ hiện tượng) và bạn có thể muốn trích xuất ít yếu tố hơn hoặc sử dụng các kết quả xiên làm nguồn hàng loạt để trích xuất các yếu tố được gọi là thứ hai.


1

nhập mô tả hình ảnh ở đây

Điều này hoàn toàn dành cho FA khám phá, trong khi nếu bạn đang làm và làm lại FA để phát triển một bảng câu hỏi, cuối cùng bạn sẽ muốn bỏ tất cả các điểm trừ những điểm màu xanh, với điều kiện bạn chỉ có hai yếu tố. Nếu có nhiều hơn hai yếu tố, bạn sẽ muốn các điểm màu đỏ trở thành màu xanh cho một số ô tải của các yếu tố khác.


2

nhập mô tả hình ảnh ở đây


3SSA1Ri2C1


4


5(thường) hoặc không có nó. Việc chuẩn hóa làm cho tất cả các biến quan trọng như nhau tại vòng quay.


Một số chủ đề để đọc thêm:

Có thể có lý do để không xoay các yếu tố?

Ma trận nào để giải thích sau khi xoay xiên - mô hình hoặc cấu trúc?

Tên của các kỹ thuật xoay nhân tố (varimax, v.v.) có nghĩa là gì?

PCA với các thành phần được quay vẫn là PCA hay là phân tích nhân tố?


1
+1. Vì tôi thấy câu hỏi này, tôi đã hy vọng rằng bạn sẽ đóng góp một câu trả lời. Nhân tiện, tôi đã ngạc nhiên rằng một câu hỏi như vậy chưa được hỏi ở đây trước đây (ít nhất là không phải ở dạng rõ ràng như vậy).
amip nói rằng Phục hồi lại

+1. Cảm ơn vi đa trả lơi! 1) Tôi hiểu riêng về phân tích nhân tố & PCA nhưng ý bạn là gì khi nói "PCA là một kỹ thuật phân tích nhân tố"? PCA & FA là 2 điều khác nhau để đáp ứng 2 mục tiêu riêng biệt phải không? Điều này có nghĩa là khi bao giờ các thành phần PCA có cấu trúc phức tạp tôi không thể sử dụng phép quay để đơn giản hóa?
GeorgeOfTheRF 11/05/2015

2) "Varimax cố gắng tối đa hóa phương sai giữa các lần tải của từng yếu tố" Ưu điểm của việc tối đa hóa phương sai giữa các lần tải là gì?
GeorgeOfTheRF 11/05/2015

Đối với (1) của bạn trong các nhận xét: Có, hai phương pháp phân tích là khác nhau. Tuy nhiên, đôi khi người ta sử dụng PCA cho mục đích FA. Xem câu trả lời của tôi và toàn bộ chủ đề có liên quan ở đó. Bạn có thể sử dụng luân phiên các yếu tố trong PCA chính xác và trên cùng một nhóm như trong FA. Liên quan đến luân chuyển, không có sự khác biệt.
ttnphns 11/05/2015

Đối với bình luận của bạn (2). Varimax tối đa hóa phương sai của độ lớn tuyệt đối của các tải trọng: do đó, các yếu tố tải cho mỗi yếu tố "phân tách" rõ ràng thành (hoàn toàn) lớn và nhỏ. Quartimax cố gắng làm như vậy để mỗi biến được tải nhiều chỉ bởi một yếu tố.
ttnphns 11/05/2015
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.