Là mọi ma trận tương quan tích cực xác định?


11

Tôi đang nói ở đây về ma trận tương quan Pearson.

Tôi thường nghe nói rằng tất cả các ma trận tương quan phải là bán chính xác dương. Hiểu biết của tôi là ma trận xác định dương phải có giá trị riêng , trong khi ma trận bán chính xác dương phải có giá trị riêng . Điều này khiến tôi nghĩ rằng câu hỏi của tôi có thể được viết lại là "Có thể các ma trận tương quan có một giá trị riêng ?"0>00=0

Có thể cho một ma trận tương quan (được tạo ra từ dữ liệu thực nghiệm, không có dữ liệu bị thiếu) có giá trị riêng hoặc giá trị riêng ? Nếu đó là một ma trận tương quan dân số thay thế thì sao?=0<0

Tôi đọc ở câu trả lời đầu cho câu hỏi này về ma trận hiệp phương sai đó

Hãy xem xét ba biến, , và . Ma trận hiệp phương sai của chúng, , không xác định dương, vì có vectơ ( ) mà không dương.XYZ=X+YMz=(1,1,1)zMz

Tuy nhiên, nếu thay vì ma trận hiệp phương sai, tôi thực hiện các tính toán đó trên ma trận tương quan thì xuất hiện dưới dạng dương. Vì vậy, tôi nghĩ rằng có thể tình hình là khác nhau đối với ma trận tương quan và hiệp phương sai.zMz

Lý do của tôi để hỏi là tôi đã được hỏi về stackoverflow , liên quan đến một câu hỏi tôi đã hỏi ở đó.


Nếu, ví dụ, hai thuộc tính là một thứ, chỉ có tên khác nhau, ma trận là số ít. Nếu hai thuộc tính thêm vào một hằng số, nó lại là số ít, et cetera .
ttnphns

Nếu một ma trận hiệp phương sai là ma trận tương quan số ít cũng là số ít.
ttnphns

2
Gần trùng lặp: Có phải mọi ma trận tương quan dương bán xác định? trong đó ít tập trung vào góc xác định so với bán xác định và mọi ma trận hiệp phương sai có xác định dương không? điều này có liên quan bởi vì hiệp phương sai về cơ bản là một mối tương quan được điều chỉnh lại.
Cá bạc

Câu trả lời:


16

Ma trận tương quan không cần phải xác định dương.

Xét một biến ngẫu nhiên vô hướng X có phương sai khác không. Thì ma trận tương quan của X với chính nó là ma trận của tất cả các ma trận, là bán xác định dương, nhưng không xác định dương.

Đối với tương quan mẫu, hãy xem xét dữ liệu mẫu cho ở trên, có quan sát đầu tiên 1 và 1, và quan sát thứ hai 2 và 2. Điều này dẫn đến tương quan mẫu là ma trận của tất cả các mẫu, do đó không xác định dương.

Một ma trận tương quan mẫu, nếu được tính theo số học chính xác (nghĩa là không có lỗi vòng) thì không thể có giá trị riêng âm.


4
Có thể đáng nói đến những ảnh hưởng có thể có của các giá trị còn thiếu đối với ma trận tương quan mẫu . Fuzz số không phải là lý do duy nhất để có được giá trị riêng âm trong ma trận tương quan / hiệp phương thức mẫu.
Cá bạc

1
Có, tôi đã không làm cho nó rõ ràng, nhưng tôi đã giả sử, theo tuyên bố câu hỏi, "không có dữ liệu bị thiếu". Một khi bạn bước vào thế giới hoang dã, lập dị của dữ liệu bị thiếu và điều chỉnh, mọi thứ sẽ ổn.
Mark L. Stone

Vâng, xin lỗi, bạn hoàn toàn đúng khi câu hỏi "không thiếu dữ liệu" - chỉ nghĩ rằng nó đáng được đề cập ở đâu đó vì những người tìm kiếm trong tương lai có thể quan tâm ngay cả khi khẩu vị của OP bị sáo rỗng!
Cá bạc

7

Các câu trả lời của @yoki và @MarkLStone (+1 cho cả hai) đều chỉ ra rằng ma trận tương quan dân số có thể có giá trị riêng nếu các biến có liên quan tuyến tính (ví dụ: trong ví dụ về @MarkLStone và X 1 = 2 X 2 trong ví dụ về @yoki).X1=X2X1=2X2

Ngoài ra, một ma trận tương quan mẫu sẽ nhất thiết phải có giá trị riêng bằng 0 nếu , tức là nếu cỡ mẫu nhỏ hơn số lượng biến. Trong trường hợp này, ma trận hiệp phương sai và ma trận tương quan sẽ có nhiều nhất là bậc n - 1 , do đó sẽ có ít nhất p - n + 1 zero eigenvalues. Xem tại sao một ma trận hiệp phương sai mẫu là số ít khi kích thước mẫu nhỏ hơn số lượng biến? Tại sao thứ hạng của ma trận hiệp phương sai nhiều nhất là n - 1 ?n<pn1pn+1n1


Dat đúng. Tôi cho rằng tôi cũng có thể đã và nên cung cấp thông tin này, nhưng mục tiêu của tôi là tạo ra một ví dụ để bác bỏ giả thuyết của OP, do đó cho thấy sự vô hiệu của nó Tuy nhiên, bạn nên điều chỉnh câu thứ hai của mình thành "Trong trường hợp này là ma trận hiệp phương sai và ma trận tương quan sẽ có nhiều thứ hạng n − 1, do đó sẽ có ít nhất (p − n + 1) zero eigenvalues. "
Mark L. Stone

4

Coi là một rv có giá trị trung bình 0 và phương sai bằng 1. Đặt Y = 2 X và tính ma trận hiệp phương sai của ( X , Y ) . Vì 2 X = Y , E [ Y 2 ] = 4 E [ X 2 ] = σ 2 YE [ X Y ] = 2 E [ X 2 ]XY=2X(X,Y)2X=YE[Y2]=4E[X2]=σY2E[XY]=2E[X2]. Do cấu hình trung bình bằng 0, các khoảnh khắc thứ hai bằng hiệp phương sai phù hợp, ví dụ: .Cov(X,Y)=E[XY]EXEY=E[XY]

Vì vậy, ma trận hiệp phương sai sẽ là: có một số không eigenvalue. Ma trận tương quan sẽ là: Λ = ( 1 1 1 1 ) , có một eigenvalue zero là tốt. Do sự tương ứng tuyến tính giữa XY , dễ hiểu tại sao chúng ta có ma trận tương quan này - đường chéo sẽ luôn là 1, và đường chéo là 1 vì mối quan hệ tuyến tính.

Λ=(1224),
Λ=(1111),
XY

Chỉ dành cho những độc giả thách thức toán học như tôi, hãy để tôi chỉ ra rằng 2Λcov(X,Y)=E(XY)E(X)E(Y)=2E[X2]=2(σX2+[E(X)]2)E(X2)=Var(X)+[E(X)]2

diagΛ1/2ΛdiagΛ1/2

@AntoniParellada, tôi không chắc chính xác ý bạn là gì - hiệp phương sai ở đây là phép tính trực tiếp. Nhưng tôi sẽ chỉnh sửa và làm cho nó rõ ràng hơn. Cảm ơn.
yoki
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.