Ước tính phân phối giá trị riêng cho dữ liệu iid (thống nhất hoặc bình thường)


9

Giả sử tôi có một tập dữ liệu với các kích thước (ví dụ ) để mỗi thứ nguyên là (cách khác, mỗi thứ nguyên ) và độc lập với lẫn nhau.dd= =20XTôi~Bạn[0;1]XTôi~N[0;1]

Bây giờ tôi vẽ một đối tượng ngẫu nhiên từ bộ dữ liệu này và lấy hàng xóm gần nhất và tính PCA trên bộ này. Trái ngược với những gì người ta có thể mong đợi, giá trị bản địa không giống nhau. Trong đồng phục 20 chiều, một kết quả điển hình trông như thế này:k= =3d

0.11952316626613427, 0.1151758808663646, 0.11170020254046743, 0.1019390988585198,
0.0924502502204256, 0.08716272453538032, 0.0782945015348525, 0.06965903935713605, 
0.06346159593226684, 0.054527131148532824, 0.05346303562884964, 0.04348400728546128, 
0.042304834600062985, 0.03229641081461124, 0.031532033468325706, 0.0266801529298156, 
0.020332085835946957, 0.01825531821510237, 0.01483790669963606, 0.0068195084468626625

Đối với dữ liệu phân phối bình thường, các kết quả dường như rất giống nhau, ít nhất là khi định cỡ lại chúng thành tổng cộng ( phân phối rõ ràng có phương sai cao hơn ở vị trí đầu tiên).1N[0;1]d

Tôi tự hỏi nếu có bất kỳ kết quả dự đoán hành vi này? Tôi đang tìm kiếm một thử nghiệm nếu chuỗi các giá trị riêng có phần thường xuyên và có bao nhiêu giá trị riêng như mong đợi và giá trị nào khác biệt đáng kể so với các giá trị dự kiến.

Đối với một cỡ mẫu (nhỏ) nhất , có kết quả nếu hệ số tương quan cho hai biến là đáng kể? Ngay cả các biến iid đôi khi sẽ có kết quả khác 0 cho thấp .kk


1
hmmm, bạn có thể in những kết quả đó với ít hình vả không? Tôi không thể phân tích chúng một cách dễ dàng ...
shabbychef

Vâng, như bạn có thể thấy độ lớn là quan tâm. Ngây thơ, người ta sẽ mong đợi tất cả chúng có cùng độ lớn.
Có QUIT - Anony-Mousse

Câu trả lời:


7

Có một tài liệu lớn về phân phối giá trị riêng cho ma trận ngẫu nhiên (bạn có thể thử lý thuyết ma trận ngẫu nhiên googling). Cụ thể, phân phối Marcenko-Pastur dự đoán phân phối giá trị riêng cho ma trận hiệp phương sai của dữ liệu với giá trị trung bình bằng 0 và phương sai bằng nhau khi số lượng biến và quan sát chuyển sang vô cùng. Liên quan chặt chẽ là phân phối hình bán nguyệt của Wigner.Tôi.Tôi.d.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.