Tôi đang thực hiện phân tích Matlab trên dữ liệu MRI nơi tôi đã thực hiện PCA trên ma trận có kích thước 10304x236 trong đó 10304 là số lượng voxels (nghĩ về chúng như pixel) và 236 là số lượng thời gian. PCA cung cấp cho tôi 236 Eigenvalues và các hệ số liên quan của chúng. Đây là tất cả tốt đẹp. Tuy nhiên, khi đến lúc quyết định giữ lại bao nhiêu thành phần, bài báo tôi đang sao chép sẽ nói như sau (xin vui lòng cho tôi biết nếu cần làm rõ vì đây chỉ là một phần ngắn của toàn bộ bài viết):
Sau đó, chúng tôi đã thực hiện mô phỏng Monte Carlo để xác định số lượng thành phần chính (PC) để trích xuất từ dữ liệu ROI phiền toái cho mỗi lần quét. Một phân phối null của các giá trị riêng dự kiến được tạo riêng cho dữ liệu mã hóa và phần còn lại cho từng đối tượng bằng cách thực hiện PCA trên dữ liệu được phân phối bình thường có thứ hạng bằng với dữ liệu ROI mã hóa và phần còn lại. Các PC từ dữ liệu ROI phiền toái thực sự sau đó đã được chọn cho phần còn lại hoặc quét mã hóa nếu giá trị riêng liên quan của chúng vượt quá khoảng tin cậy thứ 99 của các giá trị riêng từ mô phỏng Monte Carlo.
Tôi hoàn toàn không biết phải làm gì ở đây. Tôi đã quen với việc chọn các thành phần dựa trên phương sai tích lũy được giải thích. Suy nghĩ của tôi là thế này:
Sau đó, chúng tôi đã thực hiện mô phỏng Monte Carlo để xác định số lượng thành phần chính (PC) để trích xuất từ dữ liệu ROI phiền toái cho mỗi lần quét.
Sim Monte Carlo chỉ có nghĩa là làm 1000 lần (hoặc như vậy) sau đây, phải không?
Một phân phối null của các giá trị riêng dự kiến đã được tạo bằng cách thực hiện PCA trên dữ liệu được phân phối bình thường có thứ hạng bằng với dữ liệu ROI mã hóa và phần còn lại.
Đầu tiên, tôi giả sử 'thứ hạng bằng nhau' về cơ bản có nghĩa là tôi sẽ tạo ra một ma trận có cùng kích thước với bản gốc (10304x236). Xét về 'dữ liệu được phân phối bình thường có thứ hạng bằng nhau' ... điều này có nghĩa là tôi nên tạo ma trận 10304x236 của các số ngẫu nhiên từ phân phối bình thường? Matlab có một chức năng gọi là 'Normrnd' thực hiện điều này nhưng yêu cầu đầu vào mu và sigma. Tôi có thể sử dụng mu và sigma giống như những dữ liệu được lấy từ tập dữ liệu ban đầu không? Đây có phải là ít nhiều ý nghĩa của 'giá trị bản địa dự kiến' không vì tôi không biết phân phối của giá trị bản địa EXPECTED sẽ như thế nào.
Tôi đoán vấn đề của tôi ít nhiều là tôi không biết cách tạo ra một 'phân phối null' của giá trị bản địa.