Tôi có xu hướng nghe rằng thường có 3 giá trị riêng lớn nhất là quan trọng nhất, trong khi những giá trị gần bằng 0 là nhiễu
Bạn có thể kiểm tra cho điều đó. Xem bài viết liên kết trong bài này để biết thêm chi tiết. Một lần nữa, nếu bạn giao dịch với chuỗi thời gian tài chính, trước tiên bạn có thể muốn sửa lỗi cho leptokurtility (nghĩa là xem xét chuỗi lợi nhuận được điều chỉnh garch, không phải là lợi nhuận thô).
Tôi đã thấy một vài tài liệu nghiên cứu điều tra cách phân phối eigenvalue tự nhiên khác với các tính toán từ ma trận tương quan ngẫu nhiên (một lần nữa, phân biệt nhiễu với tín hiệu).
Edward:> Thông thường, người ta sẽ làm điều đó theo cách khác: nhìn vào sự phân phối đa biến của các giá trị riêng (của ma trận tương quan) đến từ ứng dụng bạn muốn. Khi bạn đã xác định được một ứng cử viên đáng tin cậy cho việc phân phối giá trị bản địa, việc tạo ra chúng khá dễ dàng.
Quy trình tốt nhất về cách xác định phân phối đa biến của giá trị bản địa của bạn phụ thuộc vào số lượng tài sản bạn muốn xem xét đồng thời (nghĩa là các kích thước của ma trận tương quan của bạn là gì). Có một trick gọn gàng nếu ( p là số tài sản).p ≤ 10p
Chỉnh sửa (bình luận của Shabbychef)
thủ tục bốn bước:
- Giả sử bạn có mẫu phụ của dữ liệu đa biến. Bạn cần một công cụ ước tính của ma trận hiệp phương sai ˜ C j cho mỗi mẫu phụ j (bạn có thể sử dụng công cụ ước tính cổ điển hoặc một phương pháp thay thế mạnh như MCD nhanh , được triển khai tốt trong matlab, SAS, S, R ,. ..). Như thường lệ, nếu bạn giao dịch với chuỗi thời gian tài chính, bạn sẽ muốn xem xét chuỗi lợi nhuận được điều chỉnh garch, chứ không phải lợi nhuận thô.j = 1 , . . . , JC~jj
- jΛ~j= = đăng nhập( λ~j1)đăng nhập( λ~jp)C~j
- CV(Λ~)J×pΛ~j
- CV(Λ~)wiCV(Λ~)wi=γi∑pi=1γiγi
J≥2