Tại sao nghịch đảo của ma trận hiệp phương sai mang lại mối tương quan một phần giữa các biến ngẫu nhiên?


32

Tôi nghe nói rằng có thể tìm thấy mối tương quan một phần giữa các biến ngẫu nhiên bằng cách đảo ngược ma trận hiệp phương sai và lấy các ô thích hợp từ ma trận chính xác kết quả như vậy (thực tế này được đề cập trong http://en.wikipedia.org/wiki/Partial_correlation , nhưng không có bằng chứng) .

Tại sao điều này là trường hợp?


1
Nếu bạn có nghĩa là để có được mối tương quan một phần trong một ô được kiểm soát cho tất cả các biến khác, thì đoạn cuối ở đây có thể làm sáng tỏ.
ttnphns 3/03/2015

Câu trả lời:


34

Khi một biến ngẫu nhiên đa biến có một không suy biến hiệp phương sai ma trận , bộ tất cả các tổ hợp tuyến tính thực sự của tạo thành một không gian vector thực chiều với cơ sở và một sản phẩm bên trong không thoái hóa do(X1,X2,,Xn)C=(γij)=(Cov(Xi,Xj))XinE=(X1,X2,,Xn)

Xi,Xj=γij .

sở kép của nó đối với sản phẩm bên trong này , , được xác định duy nhất bởi các mối quan hệE=(X1,X2,,Xn)

Xi,Xj=δij ,

đồng bằng Kronecker (bằng khi và nếu không).1i=j0

Cơ sở kép được quan tâm ở đây vì tương quan một phần của và có được là mối tương quan giữa phần còn lại sau khi chiếu nó vào không gian được kéo dài bởi tất cả các vectơ khác (hãy gọi đơn giản là "phần dư" của nó, ) và phần so sánh của , còn lại của nó . Tuy nhiên là một vector mà là trực giao với tất cả các vectơ ngoài và có sản phẩm bên trong dương tính với đâu phải là bội số không âm của , và tương tự như vậy choXiXjXiXiXjXjXiXiXiXiXiXj. Do đó chúng ta hãy viết

Xi=λiXi, Xj=λjXj

cho các số thực dương và .λiλj

Tương quan một phần là sản phẩm chấm chuẩn hóa của phần dư, không thay đổi bằng cách thay đổi kích thước:

ρij=Xi,XjXi,XiXj,Xj=λiλjXi,Xjλi2Xi,Xiλj2Xj,Xj=Xi,XjXi,XiXj,Xj .

(Trong cả hai trường hợp, mối tương quan một phần sẽ bằng 0 bất cứ khi nào phần dư là trực giao, cho dù chúng có khác không hay không.)

Chúng ta cần tìm các sản phẩm bên trong của các yếu tố cơ bản kép. Để kết thúc này, mở rộng các yếu tố cơ sở kép theo cơ sở ban đầu :E

Xi=j=1nβijXj .

Sau đó theo định nghĩa

δik=Xi,Xk=j=1nβijXj,Xk=j=1nβijγjk .

Trong ký hiệu ma trận với ma trận danh tính và ma trận thay đổi cơ sở, trạng thái nàyI=(δij)B=(βij)

I=BC .

Đó là, , đó chính xác là những gì bài viết Wikipedia đang khẳng định. Công thức trước đây cho tương quan một phần choB=C1

ρij=βijβiiβjj=Cij1Cii1Cjj1 .

3
+1, câu trả lời tuyệt vời. Nhưng tại sao bạn gọi cơ sở kép này là "cơ sở kép đối với sản phẩm bên trong này" - "đối với sản phẩm bên trong này" nghĩa là gì? Có vẻ như bạn sử dụng thuật ngữ "cơ sở kép" như được định nghĩa ở đây mathworld.wolfram.com/DualVectorSpace.html trong đoạn thứ hai ("Cho một cơ sở không gian vectơ cho tồn tại cơ sở kép .. . ") hoặc ở đây en.wikipedia.org/wiki/Dual_bocation và nó độc lập với bất kỳ sản phẩm vô hướng nào. v1,...,vnV
amip nói rằng Phục hồi lại

3
@amoeba Có hai loại đối ngẫu. Dual (tự nhiên) của bất kỳ không gian vectơ trên một trường là tập hợp các hàm tuyến tính , được gọi là . Không có cách chính tắc nào để xác định với , mặc dù chúng có cùng chiều khi là chiều hữu hạn. Bất kỳ sản phẩm bên trong tương ứng với bản đồ và ngược lại , thông qua(Tính không biến đổi của đảm bảo là một đẳng cấu không gian vectơ.) Điều này đưa ra cách để xem các phần tử củaVRϕ:VRVVVVγg:VV
g(v)(w)=γ(v,w).
γgVnhư thể chúng là các yếu tố của nhưng nó phụ thuộc vào . Vγ
whuber

3
@mpettis Những chấm đó thật khó để ý. Tôi đã thay thế chúng bằng các vòng tròn mở nhỏ để làm cho ký hiệu dễ đọc hơn. Cảm ơn đã chỉ ra điều này.
whuber

4
Câu trả lời máy bay của @Andy Ron Christensen cho các câu hỏi phức tạp có thể là thứ bạn đang tìm kiếm. Thật không may, cách tiếp cận của ông làm cho (IMHO) phụ thuộc quá mức vào các đối số và tính toán phối hợp. Trong phần giới thiệu ban đầu (xem trang. Xiii), Christensen giải thích rằng vì lý do sư phạm.
whuber

3
@whuber, Bằng chứng của bạn thật tuyệt vời. Tôi tự hỏi liệu bất kỳ cuốn sách hoặc bài viết có chứa một bằng chứng như vậy để tôi có thể trích dẫn.
Harry

12

Dưới đây là một bằng chứng chỉ với các tính toán ma trận.

Tôi đánh giá cao câu trả lời của whuber. Nó là rất sâu sắc về toán học đằng sau hậu trường. Tuy nhiên, vẫn chưa quá tầm thường khi sử dụng câu trả lời của mình để có được dấu trừ trong công thức được nêu trong wikipedia Partial_correlation # Sử dụng_matrix_inversion .

ρXiXjV{Xi,Xj}=pijpiipjj

Để có được dấu trừ này, đây là một bằng chứng khác mà tôi tìm thấy trong "Mô hình đồ họa Lauriten 1995 Trang 130". Nó chỉ đơn giản được thực hiện bởi một số tính toán ma trận.

Khóa là danh tính ma trận sau: trong đó , và .

(ABCD)1=(E1E1GFE1D1+FE1G)
E=ABD1CF=D1CG=BD1

Viết xuống ma trận hiệp phương sai như nơi là Ma trận hiệp phương sai của và là ma trận hiệp phương sai của .

Ω=(Ω11Ω12Ω21Ω22)
Ω11(Xi,Xj)Ω22V{Xi,Xj}

Đặt . Tương tự, viết dưới dạng P=Ω1P

P=(P11P12P21P22)

Theo danh tính ma trận khóa,

P111=Ω11Ω12Ω221Ω21

Chúng ta cũng biết rằng là ma trận hiệp phương sai của (từ Multivariate_n ). Do đó, mối tương quan một phần là Tôi sử dụng ký hiệu rằng mục nhập của ma trận được ký hiệu là .Ω11Ω12Ω221Ω21(Xi,Xj)|V{Xi,Xj}

ρXiXjV{Xi,Xj}=[P111]12[P111]11[P111]22.
(k,l)M[M]kl

Chỉ cần công thức đảo ngược đơn giản của ma trận 2 nhân 2,

([P111]11[P111]12[P111]21[P111]22)=P111=1detP11([P11]22[P11]12[P11]21[P11]11)

Do đó, , đó chính xác là những gì bài viết Wikipedia đang khẳng định .

ρXiXjV{Xi,Xj}=[P111]12[P111]11[P111]22=1detP11[P11]121detP11[P11]221detP11[P11]11=[P11]12[P11]22[P11]11

Nếu chúng ta cho phép i=j, rho_ii V\{X_i, X_i} = -1làm thế nào để chúng ta giải thích các yếu tố đường chéo trong ma trận chính xác?
Jason

Điểm tốt. Công thức chỉ nên hợp lệ cho i = / = j. Từ bằng chứng, dấu trừ xuất phát từ phép đảo ngược ma trận 2 nhân 2. Nó sẽ không xảy ra nếu i = j.
Po C.

Vì vậy, các số đường chéo không thể được liên kết với tương quan một phần. Họ đại diện cho cái gì? Chúng không chỉ là nghịch đảo của phương sai, phải không?
Jason

Công thức này có giá trị cho i = / = j. Nó là vô nghĩa đối với i = j.
Po C.

4

Lưu ý rằng dấu hiệu của câu trả lời thực sự phụ thuộc vào cách bạn xác định tương quan một phần. Có một sự khác biệt giữa hồi quy và trên các biến khác so với hồi quy và trên các biến khác với nhau. Theo định nghĩa thứ hai, hãy để mối tương quan giữa phần dư và là . Khi đó, mối tương quan một phần của hai (hồi quy trên và ngược lại) là .XiXjn1XiXjn2ϵiϵjρϵiϵjρ

Điều này giải thích sự nhầm lẫn trong các ý kiến ​​trên, cũng như trên Wikipedia. Định nghĩa thứ hai được sử dụng phổ biến từ những gì tôi có thể nói, do đó cần có một dấu hiệu tiêu cực.

Ban đầu tôi đã đăng một bản chỉnh sửa cho câu trả lời khác, nhưng đã mắc lỗi - xin lỗi về điều đó!

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.