Hoàn thành ma trận tương quan 3x3: hai hệ số của ba đã cho


20

Tôi đã được hỏi câu hỏi này trong một cuộc phỏng vấn.

Hãy nói rằng chúng ta có một ma trận tương quan có dạng

[10.60.80.61γ0.8γ1]

Tôi được yêu cầu tìm giá trị của gamma, đưa ra ma trận tương quan này.
Tôi nghĩ rằng tôi có thể làm một cái gì đó với các giá trị riêng, vì chúng phải lớn hơn hoặc bằng 0. (Ma trận nên là bán chính xác dương) - nhưng tôi không nghĩ cách tiếp cận này sẽ mang lại câu trả lời. Tôi đang thiếu một mẹo.

Bạn có thể vui lòng cung cấp một gợi ý để giải quyết cho cùng?


Bình luận không dành cho thảo luận mở rộng; cuộc trò chuyện này đã được chuyển sang trò chuyện .
whuber

1
Một tìm kiếm của trang web này đã dẫn trực tiếp đến một trong (một số) chủ đề có chứa các công thức có liên quan: stats.stackexchange.com/questions/5747 . Ngoài ra còn có một số âm mưu hữu ích trong câu trả lời của felix s .
whuber

Câu trả lời:


21

Chúng ta đã biết bị giới hạn giữa Ma trận tương quan phải là nửa cực dương và do đó các vị thành niên chính của nó sẽ không âm[ - 1 , 1 ]γ[1,1]

Do đó,

1(1γ2)0.6(0.60.8γ)+0.8(0.6γ0.8)0γ2+0.96γ0γ(γ0.96)0 and 1γ10γ0.96

4
@novice Bạn có thể muốn đọc về Tiêu chí của Sylvester
quyền

Câu trả lời chính xác. Tôi sẽ thêm vào như sau: Cách phổ biến để có được gamma là cố gắng tìm gamma dẫn đến ma trận tương quan của định mức hạt nhân nhỏ nhất (còn gọi là chỉ tiêu ky-fan) có thể trong khi giải các phương trình trên. Để biết thêm, hãy tìm kiếm "hoàn thành ma trận", "cảm biến nén" hoặc xem báo cáo này về chủ đề bit.ly/2iwY1nW .
Mustafa S Eisa

1
Để điều này trở thành một bằng chứng, bạn cần một kết quả theo hướng khác: nếu tất cả các vị thành niên hàng đầu không cần thiết đều và ma trận có định thức , thì ma trận là nửa cực dương. 0>00
Federico Poloni

10

Đây là một giải pháp đơn giản hơn (và có lẽ trực quan hơn):

Hãy nghĩ về hiệp phương sai như một sản phẩm bên trong trong một không gian vectơ trừu tượng . Sau đó, các mục trong ma trận tương quan là cho các vectơ , , , trong đó khung góc biểu thị góc giữa và .v 1 v 2 v 3v i , v jv i v jcosvi,vjv1v2v3vi,vjvivj

Không khó để hình dung rằng bị giới hạn bởi. Do đó, giới hạn trên cosine của nó ( ) là . Lượng giác cơ bản sau đó cho .| V 1 , v 2± v 1 , v 3| γ cos [v 1 , v 2± v 1 , v 3] γ [ 0,6 × 0,8 - 0,6 × 0,8 , 0,6 × 0,8 + 0,6 ×v2,v3|v1,v2±v1,v3|γcos[v1,v2±v1,v3]γ[0.6×0.80.6×0.8,0.6×0.8+0.6×0.8]=[0,0.96]

Chỉnh sửa: Lưu ý rằng ở dòng cuối cùng thực sự là - - sự xuất hiện thứ hai của 0,6 và 0,8 xảy ra do sự trùng hợp nhờ .cos v 1 , v 2cos v 1 , v 3tội v 1 , v 3tội v 1 , v 20,6 2 + 0,8 2 = 10.6×0.80.6×0.8cosv1,v2cosv1,v3sinv1,v3sinv1,v20.62+0.82=1


1
+1, Một lý do hình học hợp pháp (nói rằng, tôi đã không kiểm tra tính toán của bạn dù sao). Đây chính xác là những gì tôi đã đề xuất trong các bình luận cho câu hỏi (thật không may, tất cả các bình luận đã được người điều hành chuyển sang trò chuyện, xem liên kết ở trên).
ttnphns

Dường như với tôi, bạn đã "chứng minh" rằng tất cả các mối tương quan phải không âm, bởi vì có vẻ như tính toán của bạn sẽ luôn cho không cho giới hạn thấp hơn. Nếu đó không phải là trường hợp, thì bạn có thể giải thích cách tính toán của bạn nói chung không? Tôi thực sự không tin tưởng - hoặc có lẽ không hiểu - ràng buộc của bạn, bởi vì trong ba chiều trở lên, bạn luôn có thể tìm thấy một mà cả và sau đó ràng buộc của bạn luôn bằng không! (cc @ttnphns)v 1v 2 = v 1v 3 = 0 v 2v 3v1v1v2=v1v3=0v2v3
whuber

@whuber: Xin lỗi về sự nhầm lẫn. Việc tính toán không phải lúc nào cũng cho không cho giới hạn dưới. Tôi đã sửa đổi câu trả lời của mình.
yangle

Làm thế nào để bạn đáp ứng với mối quan tâm cuối cùng của tôi? Nó dường như chỉ ra giới hạn của bạn là không chính xác.
whuber

@whuber: Trong trường hợp của bạn, ⟨v1, v2⟩ = v1, v3⟩ = π / 2, do đó bị ràng buộc | ⟨v1, v2⟩ ± v1, v3⟩ | là [0, π] như mong đợi. Các ràng buộc cos⟨v1, v2⟩cos⟨v1, v3⟩∓sin⟨v1, v3⟩sin⟨v1, v2⟩ trên cũng hoạt động thành [-1, 1].
yangle

4

Đây là những gì tôi muốn nói trong nhận xét ban đầu của tôi về câu trả lời và những gì tôi cảm nhận được @yangle có thể đang nói về (mặc dù tôi không theo dõi / kiểm tra tính toán của họ).

"Ma trận nên là nửa cực dương" ngụ ý các vectơ biến đổi là một bó trong không gian Euclide. Trường hợp ma trận tương quan dễ hơn ma trận hiệp phương sai vì ba độ dài vectơ được cố định là 1. Tưởng tượng 3 vectơ đơn vị XYZ và nhớ rằng là cosin của góc . Vì vậy, và . Điều gì có thể là ranh giới cho ? Mối tương quan đó có thể đảm nhận bất kỳ giá trị nào được xác định bằng cách đăng ký Z về Y (giữ góc với nó):cos α = r x y = 0,6 cos β = r y z = 0,8 cos γ = r x z r y z = 0,8rcosα=rxy=0.6cosβ=ryz=0.8cosγ=rxzryz=0.8

nhập mô tả hình ảnh ở đây

Khi nó quay, hai vị trí đáng chú ý là wrt X cuối cùng, cả hai đều là khi Z rơi vào mặt phẳng XY. Một cái nằm giữa X và Y, và cái kia nằm ở phía đối diện của Y. Chúng được hiển thị bằng các vectơ màu xanh và đỏ. Tại cả hai vị trí này, chính xác cấu hình XYZ (ma trận tương quan) là số ít. Và đây là góc tối thiểu và tối đa (do đó tương quan) Z có thể đạt được wrt X.

Chọn công thức lượng giác để tính tổng hoặc hiệu của các góc trên mặt phẳng, chúng ta có:

cosγ=rxyryz(1rxy2)(1ryz2)=[0,0.96] làm giới hạn.

Chế độ xem hình học này chỉ là một cái nhìn khác (và cụ thể và đơn giản hơn trong trường hợp 3D) về cái mà @rightskewed thể hiện dưới dạng đại số (vị thành niên, v.v.).


Nếu X, Y, Z là các biến ngẫu nhiên, làm thế nào để bạn ánh xạ chúng tới các vectơ trong không gian 3d (Chúng chỉ có thể là vectơ trong không gian 1d). Ngoài ra nếu RV là Nx1, thì chúng sẽ là vectơ trong không gian N chiều?
người mới vào

@novice Có, ban đầu chúng là 3 vectơ trong không gian Nd, nhưng chỉ có 3 chiều là không cần thiết. Vui lòng theo liên kết thứ 2 trong câu trả lời và đọc thêm tài liệu tham khảo ở đó để giải thích không gian chủ đề .
ttnphns

4

Chơi xung quanh với trẻ vị thành niên chính có thể ổn trên 3 hoặc 3 hoặc 4 trong 4 vấn đề, nhưng hết xăng và ổn định số ở kích thước cao hơn.

Đối với một vấn đề tham số "miễn phí" như thế này, thật dễ dàng để thấy rằng tập hợp tất cả các giá trị tạo ma trận psd sẽ là một khoảng duy nhất. Do đó, nó là đủ để tìm các giá trị tối thiểu và tối đa như vậy. Điều này có thể dễ dàng được thực hiện bằng cách giải quyết một số vấn đề về lập trình SemiDefinite (SDP) tuyến tính:

  1. giảm thiểu chủ đề cho ma trận là psd.
  2. tối đa hóa γ chủ đề cho ma trận là psd.

Ví dụ: những vấn đề này có thể được xây dựng và giải quyết bằng số bằng cách sử dụng YALMIP trong MATLAB.

  1. gamma = sdpvar; A = [1 .6 .8; .6 1 gamma; .8 gamma 1]; tối ưu hóa (A> = 0, gamma)
  2. tối ưu hóa (A> = 0, -gamma)

Nhanh chóng, dễ dàng và đáng tin cậy.

BTW, nếu người phỏng vấn quần thông minh đặt câu hỏi không biết rằng Lập trình SemiDefinite, được phát triển tốt và có trình tối ưu hóa số tinh vi và dễ sử dụng để giải quyết các vấn đề thực tế, có thể được sử dụng để giải quyết vấn đề này, và nhiều hơn nữa các biến thể khó, nói với anh ấy / cô ấy rằng đây không còn là năm 1870 nữa, và đã đến lúc tận dụng lợi thế của sự phát triển tính toán hiện đại.


4

Chúng ta hãy xem xét các tập lồi sau đây

{(x,y,z)R3:[1xyx1zyz1]O3}

mà là một spectrahedron tên chiều elliptope . Đây là một mô tả của hình elip này3

nhập mô tả hình ảnh ở đây

Giao cắt hình elip này với các mặt phẳng được xác định bởi và bởi , chúng ta thu được một đoạn thẳng có điểm cuối được tô màu vàngy = 0,8x=0.6y=0.8

nhập mô tả hình ảnh ở đây

Ranh giới của elip là một bề mặt hình khối được xác định bởi

det[1xyx1zyz1]=1+2xyzx2y2z2=0

Nếu và thì phương trình bậc ba ở trên sôi xuống phương trình bậc haix=0.6y=0.8

0.96zz2=z(0.96z)=0

Do đó, giao điểm của elip với hai mặt phẳng là đoạn thẳng được tham số hóa bởi

{(0.6,0.8,t)0t0.96}

1

Mỗi ma trận bán xác định dương là một ma trận tương quan / hiệp phương sai (và ngược lại).

Để thấy điều này, hãy bắt đầu với một ma trận bán xác định dương và thực hiện phân rã eigen của nó (tồn tại bởi các phổ quang học, vì là đối xứng) trong đó là một ma trận của các hàm riêng trực giao và là một đường chéo ma trận với các giá trị eigen trên đường chéo. Sau đó, đặt trong đó là ma trận đường chéo với căn bậc hai của eignevalues ​​trên đường chéo.Một Một = U D U T U D B = U D 1 / 2 U T D 1 / 2AAA=UDUTUDB=UD1/2UTD1/2

Sau đó, phải mất một vector với zero iid trung bình và phương sai 1 mục, và lưu ý rằng cũng có không có nghĩa là, và hiệp phương sai (và tương quan) ma trận . B x AxBxA

Bây giờ, để xem mọi ma trận tương quan / hiệp phương sai là bán xác định dương rất đơn giản: Đặt là một ma trận tương quan. Sau đó, dễ nhìn thấy và vì vậy Chỉ số Rayleigh không âm đối với mọi giá trị khác 0 vì vậy là bán xác định dương.R = R T a T R a = E [ ( a T x ) 2 ] 0 a RR=E[xxT]R=RTaTRa=E[(aTx)2]0aR

Bây giờ, lưu ý rằng một ma trận đối xứng là bán xác định dương nếu và chỉ khi giá trị riêng của nó không âm, chúng tôi thấy rằng phương pháp ban đầu của bạn sẽ hoạt động: tính đa thức đặc trưng, ​​nhìn vào gốc của nó để xem chúng có âm không. Lưu ý rằng việc kiểm tra độ chính xác dương dễ dàng với Tiêu chí của Sylvester (như đã đề cập trong nhận xét của câu trả lời khác; ma trận là xác định dương nếu và chỉ khi tất cả các vị thành niên chính đều có yếu tố quyết định dương); có các phần mở rộng cho semidefinite (tất cả các vị thành niên có định thức không âm), nhưng bạn phải kiểm tra vị thành niên trong trường hợp này, so với chỉ cho xác định dương. n2nn

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.