Tôi hiểu (phần lớn) cách phân tích thành phần độc lập (ICA) hoạt động trên một tập hợp tín hiệu từ một dân số, nhưng tôi không làm cho nó hoạt động nếu các quan sát của tôi (ma trận X) bao gồm các tín hiệu từ hai quần thể khác nhau (có các phương tiện khác nhau) và tôi tôi tự hỏi nếu đó là một hạn chế cố hữu của ICA hoặc nếu tôi có thể giải quyết điều này. Tín hiệu của tôi khác với loại phổ biến được phân tích ở chỗ các vectơ nguồn của tôi rất ngắn (ví dụ 3 giá trị dài), nhưng tôi có nhiều (ví dụ 1000) quan sát. Cụ thể, tôi đang đo huỳnh quang bằng 3 màu trong đó tín hiệu huỳnh quang rộng có thể "lan tỏa" vào các máy dò khác. Tôi có 3 máy dò và sử dụng 3 fluorophores khác nhau trên các hạt. Người ta có thể nghĩ về điều này như một quang phổ độ phân giải rất kém. Bất kỳ hạt huỳnh quang nào cũng có thể có một lượng tùy ý của bất kỳ 3 fluorophors khác nhau. Tuy nhiên, tôi có một tập hợp các hạt có xu hướng có nồng độ fluorophores khá khác biệt. Ví dụ: một bộ thường có thể có nhiều fluorophore # 1 và ít fluorophore # 2, trong khi một bộ khác có ít # 1 và rất nhiều # 2.
Về cơ bản, tôi muốn giải mã hiệu ứng lan tỏa để ước tính lượng thực tế của mỗi fluorophore trên mỗi hạt, thay vì có một phần tín hiệu từ một fluorophore thêm vào tín hiệu của một hạt khác. Có vẻ như điều này có thể xảy ra đối với ICA, nhưng sau một số thất bại đáng kể (biến đổi ma trận dường như ưu tiên tách biệt các quần thể hơn là xoay vòng để tối ưu hóa độc lập tín hiệu), tôi tự hỏi liệu ICA không phải là giải pháp phù hợp hay tôi cần tiền xử lý dữ liệu của tôi theo một số cách khác để giải quyết vấn đề này.
Các biểu đồ hiển thị dữ liệu tổng hợp của tôi được sử dụng để chứng minh vấn đề. Bắt đầu với các nguồn "thật" (bảng A) bao gồm hỗn hợp 2 quần thể, tôi đã tạo ra ma trận trộn (A) "thật" và tính ma trận quan sát (X) (bảng B). FastICA ước tính ma trận S (được hiển thị trong bảng C) và thay vì tìm các nguồn thực sự của tôi, đối với tôi, nó xoay vòng dữ liệu để giảm thiểu hiệp phương sai giữa 2 quần thể.
Tìm kiếm bất kỳ đề nghị hoặc cái nhìn sâu sắc.