Phân phối giá trị bản địa đã cho


8

Tôi quen với việc sử dụng những hiểu biết sâu sắc từ Lý thuyết ma trận ngẫu nhiên để xác định số lượng các thành phần chính từ PCA của ma trận hiệp phương sai / tương quan được sử dụng để hình thành các yếu tố.

Nếu giá trị riêng liên quan đến PC đầu tiên lớn, thì điều đó có nghĩa là các giá trị riêng còn lại phải nhỏ (vì tổng giá trị riêng phải bằng dấu vết của ma trận tương quan). Khi PC đầu tiên đủ lớn, do đó có thể tất cả các giá trị bản địa này nằm dưới giới hạn dưới của bản phân phối Marcenko-Pastur. Điều này có ý nghĩa rằng chúng thấp không phải vì cơ hội ngẫu nhiên, mà vì giá trị riêng đầu tiên rất lớn. Tuy nhiên, điều đó không có nghĩa là chúng chứa thông tin quan trọng. Thay vào đó, sẽ hợp lý hơn khi đặt câu hỏi "với PC đầu tiên là một số lượng lớn, việc phân phối các giá trị bản địa còn lại sẽ như thế nào nếu dữ liệu ngẫu nhiên chịu trách nhiệm cho chúng?"

Có nghiên cứu nào giải quyết vấn đề này? Nếu có thể có được phân phối Marcenko-Pastur có điều kiện khi biết một hoặc nhiều giá trị bản địa, thì có thể tiến hành lặp đi lặp lại để xác định xem các yếu tố có phản ánh thông tin quan trọng hay không.


Bạn đang nói về dữ liệu ngẫu nhiên một yếu tố (hình cầu ngẫu nhiên)?
ttnphns

eig(Σ(Iββ)(Iββ))βn

λ~±=(1+1Q±21Q)(i=1nλij=1Jλj)/n

Câu trả lời:


3

Đây là một tài liệu về vấn đề của bạn: http://math.nyu.edu/facemony/avellane/LalouxPCA.pdf

Ý tưởng rất đơn giản, bạn tính toán phân phối Marcenko-Pastur với phương sai được sửa đổi của các phần tử của ma trận. Phương sai được sửa đổi chỉ đơn giản tương ứng với phương sai được giải thích bởi giá trị riêng khác so với phương sai đầu tiên.

σ2(i=1nλij=1Jλj)/nJσ21λ1n

ρ(λ)=nQ2π(1λ1)((λmaxλ)(λλmin)λ)

Với:

λmin/max=n(1λ1)(1+1Q±21Q)

Vì có thể có nhiều thông tin trong ma trận của bạn hơn là chỉ một giá trị riêng và tiếng ồn lớn, bạn sẽ quan sát thấy một số khác biệt. Ví dụ trong các nghiên cứu tương quan thị trường, chúng ta có thể quan sát sự rò rỉ các giá trị bản địa bằng cạnh trên của phổ. (Nó tương ứng với các lĩnh vực tài chính).

σ2

Để biết thêm thông tin về các kỹ thuật và tài liệu tham khảo hữu ích, bạn có thể xem tại: http://arxiv.org/abs/physics/0507111


Công thức này cũng cần sửa lại Q vì số lượng cột đã giảm đi 1.
Rohit Arora
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.