Khi tính toán ma trận hiệp phương sai của một mẫu, sau đó có đảm bảo có được ma trận đối xứng và xác định dương không?
Hiện tại vấn đề của tôi có một mẫu gồm 4600 vectơ quan sát và 24 chiều.
Khi tính toán ma trận hiệp phương sai của một mẫu, sau đó có đảm bảo có được ma trận đối xứng và xác định dương không?
Hiện tại vấn đề của tôi có một mẫu gồm 4600 vectơ quan sát và 24 chiều.
Câu trả lời:
Đối với một mẫu vectơ , với , vectơ trung bình mẫu là
và ma trận hiệp phương sai mẫu là
Đối với một vectơ khác 0 , chúng ta có
Do đó, Q luôn có giá trị bán xác định dương .
Điều kiện bổ sung để có giá trị xác định dương được đưa ra trong phần bình luận dưới đây. Nó diễn ra như sau.
Xác định , cho . Với mọi giá trị khác , bằng 0 khi và chỉ khi , với mỗi . Giả sử tập hợp kéo dài . Sau đó, có các số thực sao cho . Nhưng sau đó, chúng ta có , cho rằng , một mâu thuẫn. Do đó, nếu span của , thìR k α 1 , ... , α n y = α 1 z 1 + ⋯ + α n z n y ⊤ y = α 1 z ⊤ + ⋯ + α n zrmộtnk[z1...zn]=klà xác định tích cực . Điều kiện này tương đương với .
Một ma trận hiệp phương sai đúng luôn luôn đối xứng và dương * semi * xác định.
Hiệp phương sai giữa hai biến được xác định là .
Phương trình này không thay đổi nếu bạn chuyển đổi vị trí của và . Do đó ma trận phải đối xứng.y
Nó cũng phải tích cực * semi- xác định vì:
Bạn luôn có thể tìm thấy một phép biến đổi các biến của mình theo cách ma trận hiệp phương sai trở thành đường chéo. Trên đường chéo, bạn tìm thấy các phương sai của các biến được biến đổi bằng 0 hoặc dương, dễ dàng nhận thấy rằng điều này làm cho ma trận biến đổi có giá trị dương. Tuy nhiên, do định nghĩa về độ lệch là biến đổi-bất biến, nên theo sau ma trận hiệp phương sai là nửa cực dương trong bất kỳ hệ tọa độ được chọn nào.
Khi bạn ước tính ma trận hiệp phương sai của bạn (nghĩa là khi bạn tính hiệp phương sai mẫu của bạn ) với công thức bạn đã nêu ở trên, nó sẽ obv. vẫn đối xứng. Nó cũng phải là nửa cực dương (tôi nghĩ), bởi vì đối với mỗi mẫu, pdf cung cấp cho mỗi điểm mẫu xác suất bằng nhau có hiệp phương sai mẫu là hiệp phương sai của nó (ai đó vui lòng xác minh điều này), vì vậy mọi thứ nêu trên vẫn được áp dụng.
Ma trận phương sai-hiệp phương sai luôn đối xứng, vì nó có thể được chứng minh từ phương trình thực tế để tính toán từng số hạng của ma trận đã nói.
Ngoài ra, ma trận phương sai-hiệp phương sai luôn là ma trận vuông có kích thước n, trong đó n là số lượng biến trong thí nghiệm của bạn.
Eigenvector của ma trận đối xứng luôn luôn trực giao.
Với PCA, bạn xác định giá trị riêng của ma trận để xem liệu bạn có thể giảm số lượng biến được sử dụng trong thử nghiệm của mình không.
Tôi sẽ thêm vào lập luận tốt đẹp của Zen sau đó giải thích tại sao chúng ta thường nói rằng ma trận hiệp phương sai là dương nhất định nếu .
Nếu là một mẫu ngẫu nhiên của phân phối xác suất liên tục sau đó x 1 , x 2 , . . . , x n gần như chắc chắn (theo nghĩa lý thuyết xác suất) độc lập tuyến tính. Bây giờ, z 1 , z 2 , . . . , z n không độc lập tuyến tính vì ∑ n i = 1 z i = , nhưng vì x 1 , x 2 , . . . , x n là độc lập tuyến tính, z 1 , z 2 , . . . , z n là nhịp R n - 1 . Nếu n - 1 ≥ k , họ cũng khoảng R k .
Để kết luận, nếu là một mẫu ngẫu nhiên của một phân bố xác suất liên tục và n - 1 ≥ k , ma trận hiệp phương sai là dương tính nhất định.
Đối với những người có nền tảng phi toán học như tôi, người không nhanh chóng nắm bắt được các công thức toán học trừu tượng, đây là một ví dụ xuất sắc cho câu trả lời được đánh giá cao nhất. Ma trận hiệp phương sai cũng có thể được suy ra theo những cách khác.