Đó là thực sự một cái gì đó. Để tìm hiểu, chúng ta cần kiểm tra những gì chúng ta biết về chính mối tương quan.
Ma trận tương quan của biến ngẫu nhiên có giá trị véc tơ là ma trận phương sai hiệp phương sai, hoặc đơn giản là "phương sai" của phiên bản chuẩn hóa của . Nghĩa là, mỗi được thay thế bằng phiên bản được định cỡ lại, được định cỡ lại.X X iX =( X1, X2, Lọ , Xp)XXTôi
Hiệp phương sai của và là kỳ vọng về sản phẩm của các phiên bản trung tâm của chúng. Đó là, viết và , chúng ta cóX j X ′ i = X i - E [ X i ] X ′ j = X j - E [ X j ]XTôiXjX'Tôi= XTôi- E[ XTôi]X'j= Xj- E[ Xj]
Cov( XTôi, Xj) = E[ X'TôiX'j] .
Phương sai của , mà tôi sẽ viết , không phải là một số duy nhất. Nó là mảng các giá trị Var ( X ) Var ( X ) i j = Cov ( X i , X j ) .XVar( X )
Var( X )tôi j= Cov( XTôi, Xj) .
Cách nghĩ về hiệp phương sai cho việc khái quát hóa dự định là coi nó là một tenxơ . Điều đó có nghĩa là toàn bộ tập hợp các đại lượng , được lập chỉ mục bởi và từ đến , có giá trị thay đổi theo cách dự đoán đặc biệt đơn giản khi trải qua một phép biến đổi tuyến tính. Cụ thể, hãy để là một biến ngẫu nhiên có giá trị véc tơ khác được xác định bởi i j 1 p X Y = ( Y 1 , Y 2 , ... , Y q )vtôi jTôij1pXY =( Y1, Y2, ... , Yq)
YTôi= ∑j = 1pmộtjTôiXj.
Các hằng số ( và là các chỉ mục - không phải là thừa) tạo thành một mảng , và . Tính tuyến tính của kỳ vọng ngụ ý ijjq×pA=(amộtjTôiTôijjq× pj=1,...,pi=1,...,qA =( ajTôi)j = 1 , góc , pi = 1 , ... , q
Var( Y )tôi j= ∑akTôimộttôijVar( X )k l.
Trong ký hiệu ma trận,
Var( Y ) = AVar( X ) A'.
Tất cả các thành phần của thực sự là phương sai đơn biến, do Nhận dạng phân cựcVar( X )
4 Cov( XTôi, Xj) = Var( XTôi+ Xj) - Var( XTôi- Xj) .
Điều này cho chúng ta biết rằng nếu bạn hiểu phương sai của các biến ngẫu nhiên đơn biến, bạn đã hiểu hiệp phương sai của các biến bivariate: chúng là các tổ hợp phương sai tuyến tính "chỉ".
Biểu thức trong câu hỏi hoàn toàn tương tự: các biến đã được tiêu chuẩn hóa như trong . Chúng ta có thể hiểu những gì nó đại diện bằng cách xem xét ý nghĩa của nó đối với bất kỳ biến, tiêu chuẩn hóa hay không. Chúng tôi sẽ thay thế mỗi bằng phiên bản trung tâm của nó, như trong và tạo thành số lượng có ba chỉ mục, ( 1 ) X i ( 2 )XTôi( 1 )XTôi( 2 )
μ3( X )tôi j k= E[ X'TôiX'jX'k] .
Đây là những khoảnh khắc trung tâm (đa biến) của cấp3 . Như trong , chúng tạo thành một tenxơ: khi , sau đóY = A X( 4 )Y = A X
μ3( Y )tôi j k= ∑l , m , nmộttôiTôimộtmjmộtnkμ3( X )lmn.
Các chỉ mục trong phạm vi tổng ba lần này trên tất cả các kết hợp số nguyên từ đến .p1p
Sự tương tự của bản sắc phân cực là
24μ3(X)ijk=μ3(Xi+Xj+Xk)−μ3(Xi−Xj+Xk)−μ3(Xi+Xj−Xk)+μ3(Xi−Xj−Xk).
Ở phía bên tay phải, đề cập đến khoảnh khắc thứ ba trung tâm (đơn biến): giá trị mong đợi của khối lập phương của biến trung tâm. Khi các biến được tiêu chuẩn hóa, thời điểm này thường được gọi là độ lệch . Theo đó, chúng ta có thể nghĩ là độ lệch đa biến của . Nó là một thang bậc ba (nghĩa là có ba chỉ số) có giá trị là sự kết hợp tuyến tính của các độ lệch của các khoản tiền khác nhau và sự khác biệt của . Nếu chúng ta tìm cách giải thích, thì chúng ta sẽ nghĩ về các thành phần này như đo theo kích thước bất kể độ lệch được đo theo một chiều. Trong nhiều trường hợp,μ 3 ( X ) X X i pμ3μ3(X)XXip
Những khoảnh khắc đầu tiên đo lường vị trí của một phân phối;
Khoảnh khắc thứ hai (ma trận phương sai hiệp phương sai) đo lường mức độ lây lan của nó ;
Những khoảnh khắc thứ hai chuẩn (tương quan) chỉ ra cách thức lây lan khác nhau trong không gian ba chiều; vàp
Các khoảnh khắc thứ ba và thứ tư được tiêu chuẩn hóa được thực hiện để đo hình dạng của phân phối so với mức độ lây lan của nó.
Để giải thích ý nghĩa của "hình dạng" đa chiều, có thể thấy rằng chúng ta có thể hiểu PCA là một cơ chế để giảm bất kỳ phân phối đa biến nào thành một phiên bản tiêu chuẩn nằm ở gốc và trải đều theo mọi hướng. Sau khi PCA được thực hiện, sau đó, sẽ cung cấp các chỉ số đơn giản nhất về hình dạng đa chiều của phân phối. Những ý tưởng này áp dụng tốt như nhau cho dữ liệu như các biến ngẫu nhiên, bởi vì dữ liệu luôn có thể được phân tích theo cách phân phối theo kinh nghiệm của chúng.μ3
Tài liệu tham khảo
Alan Stuart & J. Keith Ord, Lý thuyết thống kê nâng cao của Kendall Phiên bản thứ năm, Tập 1: Lý thuyết phân phối ; Chương 3, Khoảnh khắc và tích lũy . Nhà xuất bản Đại học Oxford (1987).
Phụ lục: Bằng chứng về bản sắc phân cực
Đặt là các biến đại số. Có cách để cộng và trừ tất cả trong số chúng. Khi chúng tôi nâng từng khoản tiền và chênh lệch này lên sức mạnh , chọn một dấu hiệu phù hợp cho từng kết quả đó và thêm chúng, chúng tôi sẽ nhận được nhiều .2 n n n th x 1 x 2 ⋯ x nx1, Lọ , xn2nnnthứ tựx1x2⋯ xn
Chính thức hơn, hãy đặt là tập hợp của tất cả -tuples của , sao cho mọi phần tử là một vectơ có hệ số là tất cả . Yêu cầu là n ± 1 s ∈ S s = ( s 1 , s 2 , Lôi , s n ) ± 1S={1,−1}nn±1s∈Ss=(s1,s2,…,sn)±1
2nn!x1x2⋯xn=∑s∈Ss1s2⋯sn(s1x1+s2x2+⋯+snxn)n.(1)
Thật vậy, Định lý đa thức nói rằng hệ số của đơn thức (trong đó là số nguyên không âm tổng hợp với ) trong phần mở rộng của bất kỳ số hạng nào ở bên phải bên là i j nxi11xi22⋯xinnijn
(ni1,i2,…,in)si11si22⋯sinn.
Trong tổng , các hệ số liên quan đến xuất hiện theo cặp trong đó một trong mỗi cặp liên quan đến trường hợp , với hệ số tỷ lệ với lần , bằng thành và cặp kia của mỗi cặp liên quan đến trường hợp , với hệ số tỷ lệ với lần , bằng . Họ hủy trong tổng số bất cứ khi nào là số lẻ. Đối số tương tự áp dụng cho . Hậu quả là,x i 1 1 s 1 = 1 s 1 s i 1 1 1 s 1 = - 1 - 1 ( - 1 ) i 1 ( - 1 ) i 1 + 1 i 1 + 1 i 2 , Trân , i n x i x 1 x 2 ⋯ x n ( n(1)xi11s1=1s1STôi111S1= - 1- 1( - 1 )Tôi1( - 1 )Tôi1+ 1Tôi1+ 1Tôi2, ... , incác đơn thức duy nhất xảy ra với các hệ số khác không phải có các lũy thừa lẻ của tất cả các . xTôi Đơn thức duy nhất như vậy là . Nó xuất hiện với hệ sốtrong tất cả điều khoản của tổng. Do đó, hệ số của nó là, QED .x1x2⋯xn( n1 , 1 , Lọ , 1) =n!2n2nn !
Chúng tôi chỉ cần lấy một nửa của mỗi cặp được liên kết với : nghĩa là chúng tôi có thể giới hạn phía bên phải của với các điều khoản với và giảm một nửa hệ số ở phía bên trái thành. Điều đó đưa ra chính xác hai phiên bản của Danh tính phân cực được trích dẫn trong câu trả lời này cho các trường hợp và : và .x1( 1 )S1= 12n - 1n !n = 2n = 322 - 12 ! = 423 - 13 ! = 24
Tất nhiên, Nhận dạng phân cực cho các biến đại số ngay lập tức ngụ ý nó cho các biến ngẫu nhiên: hãy để mỗi là một biến ngẫu nhiên . Hãy kỳ vọng của cả hai bên. Kết quả theo sau tuyến tính của kỳ vọng.xTôiXTôi