Mối quan hệ giữa phân tích thành phần độc lập và phân tích nhân tố là gì?


67

Tôi chưa quen với Phân tích thành phần độc lập (ICA) và có hiểu biết sơ bộ về phương pháp này. Đối với tôi, ICA tương tự như Phân tích nhân tố (FA) với một ngoại lệ: ICA giả định rằng các biến ngẫu nhiên quan sát được là sự kết hợp tuyến tính của các thành phần / yếu tố độc lập không phải là gaussian trong khi mô hình FA cổ điển giả định rằng các biến ngẫu nhiên quan sát được là một sự kết hợp tuyến tính của các thành phần / yếu tố gaussian tương quan.

Là chính xác ở trên?


1
Câu trả lời này cho một câu hỏi khác ( PCA lặp đi lặp lại tìm hướng của phương sai lớn nhất; nhưng làm thế nào để tìm toàn bộ không gian con có phương sai lớn nhất? ) Rất đáng để xem xét.
Piotr Migdal

Câu trả lời:


72

nhập mô tả hình ảnh ở đây

FA, PCA và ICA, tất cả đều 'liên quan', nhiều như cả ba trong số họ tìm kiếm các vectơ cơ sở mà dữ liệu được chiếu theo, sao cho bạn tối đa hóa các tiêu chí chèn - ở đây. Hãy nghĩ về các vectơ cơ sở như chỉ gói gọn các kết hợp tuyến tính.

Z2NNw=[0.14]y

y=wTZ

y1N

Vậy những tiêu chí đó là gì?

Tiêu chí thứ hai:

Trong PCA, bạn đang tìm các vectơ cơ sở 'giải thích rõ nhất' phương sai của dữ liệu của bạn. Vectơ cơ sở đầu tiên (tức là xếp hạng cao nhất) sẽ là một vectơ phù hợp nhất với tất cả các phương sai từ dữ liệu của bạn. Cái thứ hai cũng có tiêu chí này, nhưng phải trực giao với cái thứ nhất, vân vân và vân vân. (Hóa ra các vectơ cơ sở cho PCA không là gì ngoài các hàm riêng của ma trận hiệp phương sai dữ liệu của bạn).

Trong FA, có sự khác biệt giữa nó và PCA, bởi vì FA là thế hệ, trong khi PCA thì không. Tôi đã thấy FA được mô tả là 'PCA có tiếng ồn', trong đó 'tiếng ồn' được gọi là 'các yếu tố cụ thể'. Tất cả đều giống nhau, kết luận chung là PCA và FA dựa trên thống kê bậc hai, (hiệp phương sai), và không có gì ở trên.

Tiêu chí đặt hàng cao hơn:

Trong ICA, bạn lại tìm thấy các vectơ cơ sở, nhưng lần này, bạn muốn các vectơ cơ sở cho kết quả, sao cho vectơ kết quả này là một trong những thành phần độc lập của dữ liệu gốc. Bạn có thể làm điều này bằng cách tối đa hóa giá trị tuyệt đối của kurtosis bình thường hóa - một thống kê bậc 4. Đó là, bạn chiếu dữ liệu của mình lên một số vectơ cơ sở và đo lường mức độ tổn thương của kết quả. Bạn thay đổi vectơ cơ sở của mình một chút, (thường là thông qua độ dốc), sau đó đo lại mức độ tổn thương một lần nữa, v.v ... Cuối cùng, bạn sẽ xảy ra một vectơ cơ sở mang lại cho bạn kết quả có khả năng gây tổn thương cao nhất và đây là sự độc lập của bạn thành phần.

Sơ đồ trên cùng có thể giúp bạn hình dung nó. Bạn có thể thấy rõ các vectơ ICA tương ứng với các trục của dữ liệu, (độc lập với nhau), trong khi các vectơ PCA cố gắng tìm các hướng trong đó phương sai được tối đa hóa. (Hơi giống kết quả).

Nếu trong sơ đồ trên cùng, các vectơ PCA trông giống như chúng gần như tương ứng với các vectơ ICA, thì đó chỉ là sự trùng hợp. Đây là một ví dụ khác về dữ liệu trộn và ma trận trộn khác nhau, nơi chúng rất khác nhau. ;-)

nhập mô tả hình ảnh ở đây


2
Thấy rằng bạn quen thuộc với cả hai phương pháp. Là một người có thẩm quyền, bạn có thể trả lời nếu những phương pháp đó vốn ngụ ý rằng các vectơ cơ sở là trực giao? Làm thế nào người ta có thể khám phá các thành phần chính hoặc độc lập có hình chiếu khác không với nhau, giống như hai đám mây điểm được định hướng ở góc 45 độ với nhau?
mbaitoff

2
@mbaitoff ICA sẽ phục hồi một tập các vectơ cơ sở trực giao, vâng. Thứ hai, khi bạn có như bạn đang hỏi, hai tín hiệu có hình chiếu khác không - đó chính xác là những gì ICA đang cố gắng hoàn tác. Đó là lý do tại sao các vectơ cơ sở cuối cùng được tìm thấy bởi ICA là trực giao với nhau. Sau đó, khi bạn chiếu dữ liệu của mình lên hai vectơ mới đó, chúng sẽ trực giao với nhau.
Spacey

1
@Tarantula Tôi đã hỏi một câu hỏi về những gì tôi đang nói: stats.stackexchange.com/questions/6575/ , bạn có thể xem hình minh họa, i.stack.imgur.com/U6fWb.png . Tôi không thể hiểu làm thế nào một cơ sở trực giao sẽ mô tả hai đám mây đó. Rõ ràng đối với tôi rằng hai vectơ mô tả các hướng dao động chính không phải là trực giao.
mbaitoff

@mbaitoff Bạn đã lấy dữ liệu của mình từ hai cảm biến và bạn vẽ chúng với nhau và bạn thấy hai chế độ đó, vì vậy bạn biết rằng chúng ít nhất có mối tương quan với nhau. Sau đó, câu hỏi trở thành, làm thế nào bạn có thể chiếu tất cả các điểm bạn có ở đó, sao cho chúng độc lập? (nghĩa là trên cơ sở trực giao như những gì ICA tìm thấy). Đó là những gì ICA tìm thấy cho bạn. Tôi không hiểu ý của bạn khi bạn nói "Tôi không thể hiểu làm thế nào một cơ sở trực giao sẽ mô tả hai đám mây đó." Tại sao không?
Spacey

@Tarantula ơi, giờ tôi hiểu điều đó có nghĩa là gì! Tôi nghĩ nó giống như 'tìm hai vectơ trực giao trên cốt truyện gốc' trong khi thực sự nó có nghĩa là 'tìm hai vectơ trên cốt truyện gốc một phép chiếu trên đó sẽ biến chúng thành trực giao (độc lập)'.
mbaitoff

31

Không hẳn. Phân tích nhân tố hoạt động với khoảnh khắc thứ hai và thực sự hy vọng rằng dữ liệu là Gaussian để tỷ lệ khả năng và những thứ như thế không bị ảnh hưởng bởi tính phi quy tắc. Mặt khác, ICA được thúc đẩy bởi ý tưởng rằng khi bạn thêm mọi thứ, bạn sẽ có được điều gì đó bình thường, do CLT và thực sự hy vọng rằng dữ liệu là không bình thường, để các thành phần không bình thường có thể được trích xuất từ họ Để khai thác tính phi quy tắc, ICA cố gắng tối đa hóa khoảnh khắc thứ tư của sự kết hợp tuyến tính của các đầu vào:

maxa:a=11ni[a(xix¯)]4

Nếu bất cứ điều gì, ICA nên được so sánh với PCA, tối đa hóa khoảnh khắc thứ hai (phương sai) của sự kết hợp tiêu chuẩn của các đầu vào.


câu trả lời hay và giòn
Subhash C. Davar

khoảnh khắc thứ 4 ở đây là gì? PL.EXPLAIN.
Subhash C. Davar

@ subhashc.davar Khoảnh khắc thứ 4 là kurtosis - tức là mức độ dữ liệu nặng hơn hoặc nhẹ hơn so với phân phối bình thường. vi.wikipedia.org/wiki/Kurtosis
javadba
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.