Điều kiện đủ và cần thiết cho giá trị riêng không của ma trận tương quan


11

Cho biến ngẫu nhiên , với phân phối xác suất , ma trận tương quan là bán xác định dương, tức là giá trị riêng của nó là dương hoặc bằng không.nXiP(X1,,Xn)Cij=E[XiXj]E[Xi]E[Xj]

Tôi quan tâm đến các điều kiện về đó là cần thiết và / hoặc đủ cho có zero giá trị riêng. Chẳng hạn, một điều kiện đủ là các biến ngẫu nhiên không độc lập: đối với một số số thực . Ví dụ: nếu , thì là một hàm riêng của với giá trị riêng bằng 0. Nếu chúng ta có hạn chế tuyến tính độc lập trên là thuộc loại này, nó sẽ bao hàm zero giá trị riêng.PCmiuiXi=0uiP(X1,,Xn)=δ(X1X2)p(X2,,Xn)u=(1,1,0,,0)CmXim

Có ít nhất một khả năng bổ sung (nhưng tầm thường), khi cho một số (ví dụ ), kể từ đó trường hợp có một cột và một dòng số không: . Vì nó không thực sự thú vị, tôi giả định rằng phân phối xác suất không phải là dạng đó.Xa=E[Xa]aP(X1,,Xn)δ(XaE[Xa])CijCia=Cai=0,i

Câu hỏi của tôi là: các ràng buộc tuyến tính là cách duy nhất để tạo ra các giá trị riêng không (nếu chúng ta cấm ngoại lệ tầm thường được đưa ra ở trên), hoặc các ràng buộc phi tuyến tính trên các biến ngẫu nhiên cũng có thể tạo ra các giá trị riêng của không?C


1
Theo định nghĩa, một tập hợp các vectơ bao gồm vectơ không phụ thuộc tuyến tính, vì vậy khả năng bổ sung của bạn không có gì mới hoặc khác biệt. Bạn có thể vui lòng giải thích những gì bạn có nghĩa là bởi "có một eigenvalue"? Trông giống như một số lỗi đánh máy. m
whuber

@whuber: vâng, lỗi đánh máy. Đã sửa. Tôi nghĩ hai điều kiện khác nhau: một là về mối quan hệ giữa các biến, trong khi điều kiện còn lại là về xác suất của biến duy nhất (cụ thể là ). p(Xa)=δ(XaE(Xa))
Adam

Việc xây dựng câu hỏi của bạn là khó hiểu. Nó trông giống như một định lý cơ bản của đại số tuyến tính, nhưng các tham chiếu đến các biến ngẫu nhiên "độc lập" cho thấy nó có thể là về một cái gì đó khác hoàn toàn. Sẽ là chính xác để hiểu rằng mỗi khi bạn sử dụng "độc lập", bạn có nghĩa là theo nghĩa độc lập tuyến tính và không phải theo nghĩa của các biến ngẫu nhiên độc lập (theo thống kê)? Tham chiếu của bạn đến "dữ liệu bị thiếu" thậm chí còn gây nhầm lẫn hơn nữa, bởi vì nó cho thấy "các biến ngẫu nhiên" của bạn thực sự có thể có nghĩa chỉ là các cột của ma trận dữ liệu. Sẽ thật tốt khi thấy những ý nghĩa này được làm rõ.
whuber

@whuber: Tôi đã chỉnh sửa câu hỏi. Hy vọng nó rõ ràng hơn.
Adam

Điều kiện để độc lập không nhất thiết phải bằng 0 (bất kỳ hằng số nào cũng được), trừ khi giá trị trung bình của mỗi bằng không. X iiuiXi=0Xi
Sextus Empiricus

Câu trả lời:


6

Có lẽ bằng cách đơn giản hóa ký hiệu, chúng ta có thể đưa ra những ý tưởng thiết yếu. Hóa ra chúng ta không cần liên quan đến kỳ vọng hoặc công thức phức tạp, bởi vì mọi thứ hoàn toàn là đại số.


Bản chất đại số của các đối tượng toán học

Câu hỏi liên quan đến mối quan hệ giữa (1) ma trận hiệp phương sai của một tập hợp hữu hạn các biến ngẫu nhiên và (2) mối quan hệ tuyến tính giữa các biến đó, được coi là vectơ .X1,,Xn

Không gian vectơ trong câu hỏi là tập hợp tất cả các biến ngẫu nhiên phương sai hữu hạn (trên bất kỳ không gian xác suất đã cho nào ) modulo không gian con của các biến gần như chắc chắn, được ký hiệu là (Nghĩa là, chúng tôi coi hai biến ngẫu nhiên và là cùng một vectơ khi không có khả năng khác với kỳ vọng của nó.) Chúng tôi chỉ xử lý vectơ hữu hạn không gian được tạo bởi đó là điều làm cho vấn đề đại số này chứ không phải là vấn đề phân tích.L 2 ( Ω , P ) / R . X Y X - Y V X i ,(Ω,P)L2(Ω,P)/R.XYXYVXi,

Những gì chúng ta cần biết về phương sai

V không chỉ là một không gian vectơ: nó là một mô đun bậc hai, bởi vì nó được trang bị phương sai. Tất cả chúng ta cần biết về phương sai là hai điều:

  1. Phương sai là một hàm có giá trị vô hướng với thuộc tính cho tất cả các vectơQ ( một X ) = một 2 Q ( X ) X .QQ(aX)=a2Q(X)X.

  2. Phương sai là không suy biến.

Thứ hai cần một số lời giải thích. xác định "sản phẩm chấm", là dạng song tuyến đối xứng được cho bởiQ

XY=14(Q(X+Y)Q(XY)).

(Tất nhiên đây không có gì khác ngoài hiệp phương sai của các biến và ) Các vectơ và là trực giao khi tích của chúng là Phần bù trực giao của bất kỳ tập vectơ nào bao gồm tất cả các vectơ trực giao đến mọi yếu tố của được viếtXX Y 0. MộtV Một ,Y.XY0.AVA,

A0={vVa.v=0 for all vV}.

Nó rõ ràng là một không gian vector. Khi , là không suy biến.QV0={0}Q

Cho phép tôi chứng minh rằng phương sai thực sự là không biến đổi, mặc dù nó có vẻ rõ ràng. Giả sử là một phần tử khác 0 của Điều này có nghĩa là cho tất cảtương đương,V 0 . X Y = 0 Y V ;XV0.XY=0YV;

Q(X+Y)=Q(XY)

với mọi vectơ Lấy choY = XY.Y=X

4Q(X)=Q(2X)=Q(X+X)=Q(XX)=Q(0)=0

và do đó Tuy nhiên, chúng tôi biết (có thể sử dụng Bất đẳng thức của Ch Quashev, có lẽ) rằng các biến ngẫu nhiên duy nhất có phương sai bằng 0 gần như chắc chắn là hằng số, xác định chúng với vectơ 0 trong QED.V ,Q(X)=0.V,

Giải thích các câu hỏi

Quay trở lại các câu hỏi, trong ký hiệu trước, ma trận hiệp phương sai của các biến ngẫu nhiên chỉ là một mảng thông thường của tất cả các sản phẩm dấu chấm của chúng,

T=(XiXj).

Có một cách hay để suy nghĩ về : nó định nghĩa một phép biến đổi tuyến tính trên theo cách thông thường, bằng cách gửi bất kỳ vectơ vào vectơ có thành phần được đưa ra bởi quy tắc nhân ma trậnR n x = ( x 1 , ... , x n ) R n TTRnx=(x1,,xn)Rni thT(x)=y=(y1,,xn)ith

yi=j=1n(XiXj)xj.

Các hạt nhân của sự biến đổi tuyến tính này là không gian con nó gửi đến số không:

Ker(T)={xRnT(x)=0}.

Phương trình đã nói ở trên ngụ ý rằng khi với mọitôixKer(T),i

0=yi=j=1n(XiXj)xj=Xi(jxjXj).

Vì điều này đúng với mọi nên nó giữ cho tất cả các vectơ được kéo dài bởi : cụ thể là, chínhDo đó, khi vectơ được cung cấp bởi nằm trong Bởi vì phương sai là không biến đổi, điều này có nghĩa là Nghĩa là, mô tả một phụ thuộc tuyến tính giữa biến ngẫu nhiên ban đầu.X i V x Ker ( T ) , j x j X j V 0 . j x j X j = 0. x ni,XiVxKer(T),jxjXjV0.jxjXj=0.xn

Bạn có thể dễ dàng kiểm tra xem chuỗi lý luận này có thể đảo ngược không:

Các phụ thuộc tuyến tính giữa các như các vectơ tương ứng một-một với các phần tử của hạt nhân T .Xj T.

(Hãy nhớ rằng, tuyên bố này vẫn coi như được xác định cho đến một sự thay đổi liên tục về vị trí - nghĩa là, như là các yếu tố của thu thập chỉ là các biến ngẫu nhiên.)L 2 ( Ω , P ) / RXjL2(Ω,P)/R

Cuối cùng, theo định nghĩa, một giá trị riêng của là bất kỳ vô hướng nào tồn tại một vectơ khác 0 với Khi là một giá trị riêng, không gian của các hàm riêng liên quan là (rõ ràng) là hạt nhân củaλ x T ( x ) = λ x . λ = 0 T .TλxT(x)=λx.λ=0T.


Tóm lược

Chúng tôi đã đi đến câu trả lời cho các câu hỏi: tập hợp các phụ thuộc tuyến tính của các biến ngẫu nhiên, qua các phần tử của tương ứng với một hạt nhân của ma trận hiệp phương sai của họ Điều này là như vậy bởi vì phương sai là một dạng bậc hai không suy biến. Hạt nhân cũng là không gian eigenspace được liên kết với giá trị riêng 0 (hoặc chỉ không gian con bằng 0 khi không có giá trị riêng 0).T.L2(Ω,P)/R,T.


Tài liệu tham khảo

Tôi đã chấp nhận phần lớn ký hiệu và một số ngôn ngữ của Chương IV trong

Jean-Pierre Serre, Một khóa học về số học. Springer-Verlag năm 1973.


Whoa, thật tuyệt! Chỉ cần một câu hỏi để chắc chắn rằng tôi hiểu tất cả mọi thứ: khi bạn viết " dưới dạng vectơ", bạn không có nghĩa là thu thập các biến ngẫu nhiên trong một vectơ (tức là ) hay bạn? Nếu tôi đúng, tôi đoán rằng bạn đang thu thập các giá trị có thể của biến ngẫu nhiên vào một vectơ, trong khi phân phối xác suất được ẩn trong định nghĩa của phương sai, phải không? X = ( X 1 , Mạnh , X n ) X iXjX=(X1,,Xn)Xi
Adam

Tôi nghĩ rằng khía cạnh chính không hoàn toàn rõ ràng là như sau (có thể chỉ cho thấy sự thiếu hiểu biết chính thức của tôi về lý thuyết xác suất): bạn dường như cho thấy rằng nếu có 0 eigenvalue, thì chúng ta có ví dụ . Ràng buộc này không đề cập đến phân phối xác suất , được ẩn trong (Tôi nghĩ đây là điểm thông minh về trình diễn này). Nhưng điều đó có nghĩa gì khi có mà không tham chiếu đến ? Hoặc nó chỉ ngụ ý rằng , nhưng làm thế nào để chúng ta biết rằng nó phải là sự kết hợp tuyến tính của trong hàm delta ? P Q X 1 = X 2 P P δ ( X 1 - X 2 ) X 1 X 2X1=X2PQX1=X2PPδ(X1X2)X1X2
Adam

Tôi e rằng tôi không hiểu việc bạn sử dụng "hàm delta" trong ngữ cảnh này, Adam. Đó là một phần vì tôi thấy không cần nó và một phần vì ký hiệu không rõ ràng: đó sẽ là đồng bằng Kronecker hay đồng bằng Dirac chẳng hạn?
whuber

Nó sẽ là Kronecker hoặc Dirac tùy thuộc vào các biến (rời rạc hoặc liên tục). Những của đồng bằng có thể là một phần của biện pháp tích hợp, ví dụ như tôi tích hợp trên 2-by-2 ma trận (vì vậy bốn biến thực , , và , với một số trọng lượng (nói ) hoặc tôi tích hợp trên một nhóm phụ. Nếu đó là ma trận đối xứng (ngụ ý ví dụ ), tôi có thể chính thức áp đặt điều đó bằng cách nhân với . Đây sẽ là một ràng buộc tuyến tính Một ví dụ về ràng buộc phi tuyến tính được đưa ra trong các bình luận bên dưới câu trả lời của Martijn Weterings.X 1 X 2 X 3 X 4 P = exp ( - t r ( M . M T ) ) X 2 = X 3 P δ ( X 1 - X 2 )MX1X2X3X4P=exp(tr(M.MT))X2=X3Pδ(X1X2)
Adam

(tiếp theo) Câu hỏi là: những gì có thể của các ràng buộc phi tuyến tính mà tôi có thể thêm vào các biến của mình có thể tạo ra một giá trị 0. Theo câu trả lời của bạn, dường như: chỉ có ràng buộc phi tuyến tính ngụ ý ràng buộc tuyến tính (như được minh họa trong các bình luận bên dưới câu trả lời của Martijn Weterings). Có lẽ vấn đề là cách suy nghĩ của tôi về vấn đề là từ quan điểm của nhà vật lý, và tôi đấu tranh để giải thích nó bằng một ngôn ngữ khác (tôi nghĩ đây là nơi thích hợp để đặt câu hỏi này, không có vật lý.SE).
Adam

5

Độc lập tuyến tính không chỉ là đủ mà còn là một điều kiện cần thiết

Để chỉ ra rằng ma trận phương sai hiệp phương sai có các giá trị riêng bằng 0 khi và chỉ khi các biến không độc lập tuyến tính, thì vẫn chỉ cho thấy rằng "nếu ma trận có giá trị riêng bằng 0 thì các biến không độc lập tuyến tính".

Nếu bạn có giá trị riêng bằng 0 cho thì có một số kết hợp tuyến tính (được xác định bởi eigenvector )vCij=Cov(Xi,Xj)v

Y=i=1nvi(Xi)

như vậy mà

Cov(Y,Y)=i=1nj=1nvivjCov(Xi,Xj)=i=1nvij=1nvjCij=i=1nvi0=0

điều đó có nghĩa là cần phải là một hằng số và do đó các biến phải thêm vào một hằng số và là chính các hằng số (trường hợp tầm thường) hoặc không độc lập tuyến tính.X iYXi

- dòng đầu tiên trong phương trình với là do thuộc tính của hiệp phương saiCov(Y,Y)

Cov(aU+bV,cW+dX)=acCov(U,W)+bcCov(V,W)+adCov(U,X)+bdCov(V,X)

- bước từ dòng thứ hai đến dòng thứ ba là do thuộc tính của giá trị 0 eigenvalue

j=1nvjCij=0


Các ràng buộc phi tuyến tính

Vì vậy, vì các ràng buộc tuyến tính là một điều kiện cần thiết (không chỉ đủ), các ràng buộc phi tuyến tính sẽ chỉ có liên quan khi chúng gián tiếp ngụ ý một ràng buộc tuyến tính (cần thiết).

Trong thực tế, có một sự tương ứng trực tiếp giữa các hàm riêng liên quan đến giá trị riêng không và các ràng buộc tuyến tính.

Cv=0Y=i=1nviXi=const

Do đó, các ràng buộc phi tuyến tính dẫn đến một giá trị riêng không bằng 0, phải kết hợp với nhau, tạo ra một số ràng buộc tuyến tính.


Làm thế nào các ràng buộc phi tuyến tính có thể dẫn đến các ràng buộc tuyến tính

Ví dụ của bạn trong các ý kiến ​​có thể chỉ ra điều này bằng trực giác làm thế nào các ràng buộc phi tuyến tính có thể dẫn đến các ràng buộc tuyến tính bằng cách đảo ngược đạo hàm. Các ràng buộc phi tuyến tính sau đây

a2+b2=1c2+d2=1ac+bd=0adbc=1

có thể được giảm xuống

a2+b2=1c2+d2=1ad=0b+c=0

Bạn có thể nghịch đảo này. Giả sử bạn có các ràng buộc phi tuyến tính cộng với tuyến tính, thì không có gì lạ khi tưởng tượng làm thế nào chúng ta có thể thay thế một trong các ràng buộc tuyến tính bằng một ràng buộc phi tuyến tính, bằng cách điền các ràng buộc tuyến tính vào các ràng buộc phi tuyến tính. Ví dụ: khi chúng ta thay thế và ở dạng phi tuyến tính thì bạn có thể tạo một mối quan hệ khác . Và khi bạn nhân và thì bạn nhận được .b = - c a 2 + b 2 = 1 a d - b c = 1 a = d c = - b a c = - b da=db=ca2+b2=1adbc=1a=dc=bac=bd


Tôi đoán điều này (và câu trả lời của whuber) là một câu trả lời gián tiếp cho câu hỏi của tôi (đó là: "là sự phụ thuộc tuyến tính là cách duy nhất để có được giá trị riêng 0" theo cách này: ngay cả khi sự phụ thuộc giữa các biến ngẫu nhiên là không tuyến tính, nó luôn có thể được viết lại dưới dạng phụ thuộc tuyến tính bằng cách chỉ viết . Mặc dù tôi đã thực sự tìm cách để mô tả các ràng buộc phi tuyến tính có thể có, nhưng tôi đoán nó vẫn là một kết quả hữu ích. Y=iνiXi
Adam

Vâng, tôi biết ... điều tôi đang nói là nếu có sự phụ thuộc phi tuyến tính không có giá trị riêng, thì theo câu trả lời của bạn, điều đó có nghĩa là sự phụ thuộc phi tuyến tính theo một cách nào đó thành một sự phụ thuộc tuyến tính. Nó là phiên bản yếu hơn của những gì tôi đang tìm kiếm, nhưng vẫn còn một cái gì đó.
Adam

Việc bạn đưa ra một ví dụ không hoạt động, điều đó không có nghĩa là không thể như vậy ...
Adam

Dưới đây là một ví dụ ngược lại về những gì bạn nói (nếu bạn nghĩ không phải vậy, thì nó có thể giúp chúng tôi tìm ra vấn đề sai với công thức của tôi về vấn đề này :)): Lấy ma trận ngẫu nhiên 2 nhân 2 , với ràng buộc phi tuyến tính và . 3 ràng buộc phi tuyến tính này có thể được viết lại theo 2 ràng buộc tuyến tính và một ràng buộc tuyến tính: có nghĩa là ma trận hiệp phương sai có hai 0 hàm riêng. Xóa ràng buộc và chúng biến mất. MM.MT=1detM=1detM=1
Adam

M 12 = X 2 M 21 = X 3 M 22M11=X1 , , và . Các ràng buộc là , , (chỉ có hai là độc lập). Họ không ngụ ý một giá trị riêng không. Tuy nhiên, việc thêm có nghĩa là hai hàm riêng có 0 giá trị riêng. M12=X2M21=X3M22=X4X12+X22=1X32+X42=1X1X3+X2X4=0X1X4X2X3=1
Adam

2

Giả sử có một hàm riêng với giá trị riêng tương ứng , thì . Do đó, bởi sự bất bình đẳng của Ch Quashev, gần như chắc chắn không đổi và bằng với . Nghĩa là, mọi giá trị riêng không tương ứng với một giới hạn tuyến tính, cụ thể là . Không cần phải xem xét bất kỳ trường hợp đặc biệt.v 0 var ( v T X ) = v T C v = 0 v T X v T T E [ X ] v T X = v T E [ X ]Cv0var(vTX)=vTCv=0vTXvTE[X]vTX=vTE[X]

Vì vậy, chúng tôi kết luận:

"là các ràng buộc tuyến tính, cách duy nhất để tạo ra giá trị riêng không [?]"

Đúng.

"các ràng buộc phi tuyến tính trên các biến ngẫu nhiên cũng có thể tạo ra giá trị riêng của C không?"

Có, nếu chúng ngụ ý các ràng buộc tuyến tính.


Tôi đồng ý. Tôi đã hy vọng rằng người ta có thể cụ thể hơn về loại ràng buộc phi tuyến tính, nhưng tôi đoán rằng thật khó để làm tốt hơn nếu chúng ta không chỉ định các ràng buộc.
Adam

2

Hiệp phương sai của là đối xứng nên bạn có thể chẩn đoán nó là , với các giá trị riêng trong ma trận đường chéoViết lại điều này dưới dạng , rhs là ma trận hiệp phương sai của , do đó, giá trị riêng trên các lhs tương ứng với các tổ hợp tuyến tính của với các phân phối suy biến.X C = Q Λ Q T Λ . Λ = Q T C Q Q T X XCXC=QΛQTΛ.Λ=QTCQQTXX


Đây là một mô tả ngắn gọn rất hay, nhưng làm thế nào chúng ta có thể làm cho nó trực quan hơn rằng ? QTCQ=cov(QTX)
Sextus Empiricus
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.