Tại sao một ma trận hiệp phương sai mẫu là số ít khi kích thước mẫu nhỏ hơn số lượng biến?


30

Giả sử tôi có phân phối Gaussian đa biến . Và tôi giữ lấy n quan sát (mỗi người một p -vector) từ phân phối này và tính toán mẫu hiệp phương sai ma trận S . Trong bài báo này , các tác giả nói rằng ma trận hiệp phương sai mẫu được tính với p > n là số ít.pnpSp>n

  • Làm thế nào là đúng hoặc có nguồn gốc?
  • Có lời giải thích nào không?

4
Lưu ý rằng điều này là độc lập thực sự với phân phối cơ bản: nó không cần phải là Gaussian.
amip nói phục hồi Monica

Câu trả lời:


22

Một số sự thật về thứ hạng ma trận, được cung cấp mà không có bằng chứng (nhưng bằng chứng về tất cả hoặc gần như tất cả chúng nên được đưa ra trong các văn bản đại số tuyến tính tiêu chuẩn, hoặc trong một số trường hợp được đặt làm bài tập sau khi cung cấp đủ thông tin để có thể làm như vậy):

Nếu B là hai ma trận phù hợp, thì:AB

(i) thứ hạng cột của = thứ hạng hàng của AAA

(ii) rank(A)=rank(AT)=rank(ATA)=rank(AAT)

(iii) rank(AB)min(rank(A),rank(B))

(iv) rank(A+B)rank(A)+rank(B)

(v) nếu là ma trận vuông có thứ hạng đầy đủ, thì thứ hạng ( A B ) = thứ hạng ( A )Brank(AB)=rank(A)

Xét ma trận của dữ liệu mẫu, y . Từ những điều trên, thứ hạng của y nhiều nhất là tối thiểu ( n , p ) .n×pyymin(n,p)

Hơn nữa, từ trên rõ ràng thứ hạng của sẽ không lớn hơn thứ hạng của y (bằng cách xem xét tính toán của S ở dạng ma trận, có lẽ có một số đơn giản hóa).SyS

Nếu thì xếp hạng ( y ) < p trong trường hợp đó xếp hạng ( S ) < p .n<prank(y)<prank(S)<p


câu trả lời tốt đẹp Nó không hoàn toàn rõ ràng tuy nhiên làm thế nào y và S liên quan đến A và B?
Matifou

S được tính từ y; ("X" trong bài viết gốc). Bạn có thể sử dụng các sự kiện về y và các thao tác được thực hiện trên nó (thông qua các quy tắc trên) để có được một ràng buộc về thứ hạng của S. Các vai trò của A và B thay đổi từ bước này sang bước khác.
Glen_b -Reinstate Monica

14

Câu trả lời ngắn cho câu hỏi của bạn là thứ hạng . Vậy nếu p > n , thì S là số ít.(S)n1p>nS

Để có câu trả lời chi tiết hơn, hãy nhớ rằng ma trận hiệp phương sai mẫu (không thiên vị) có thể được viết là

S=1n1i=1n(xix¯)(xix¯)T.

nxi(S)p>nx¯(S)n1

Spn


4
Bạn có thể giải thích rõ hơn về lý do trừ 1 vì chúng tôi tập trung vào từng quan sátx¯


Câu trả lời tốt đẹp! Có lẽ chỉ cần thêm một lời giải thích / liên kết cho thực tế câu lệnh chúng ta đang tổng hợp 𝑛 ma trận, mỗi câu có thứ hạng 1 ? Cảm ơn!
Matifou

10

Khi bạn nhìn nhận tình huống đúng cách, kết luận là trực giác rõ ràng và ngay lập tức.

Bài đăng này cung cấp hai cuộc biểu tình. Đầu tiên, ngay bên dưới, là bằng lời. Nó tương đương với một bản vẽ đơn giản, xuất hiện ở cuối. Ở giữa là một lời giải thích về ý nghĩa của các từ và bản vẽ.


n pp×pXnpXpnpnRnmin(p,n)min(p,n)p>nnp

Tất cả thuật ngữ này được giải thích đầy đủ trong phần còn lại của bài viết này.

XRn1n1XXn1


Đại số tuyến tính là tất cả về theo dõi kích thước của không gian vectơ. Bạn chỉ cần đánh giá cao một vài khái niệm cơ bản để có trực giác sâu sắc cho những khẳng định về thứ hạng và điểm kỳ dị:

  1. m×nMnVnmVmxVnMx=yVm

  2. VnMVmn

  3. Kích thước của bất kỳ không gian vectơ phụ nào cũng không thể vượt quá kích thước của không gian mà nó nằm. Đây là một định lý, nhưng một lần nữa nó là hiển nhiên và dễ dàng để chứng minh.

  4. Thứ hạng của một phép biến đổi tuyến tính là thứ nguyên của hình ảnh của nó. Thứ hạng của ma trận là thứ hạng của phép biến đổi tuyến tính mà nó đại diện. Đây là những định nghĩa.

  5. Mmnn

Mmnxn

ym=Mmnxn

m×nMnxmy

yaaMmn,Llm,,Bbc,AabnxnVnxnm,l,,c,b,a

Vnmin(a,b,c,,l,m,n)


XX

! [nhập mô tả hình ảnh ở đây

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.