Để giải thích về nhận xét của tôi, tôi đã từng dạy hiệp phương sai như là thước đo của sự đồng biến (trung bình) giữa hai biến, giả sử và .xy
Rất hữu ích khi nhớ lại công thức cơ bản (đơn giản để giải thích, không cần nói về các kỳ vọng toán học cho một khóa học giới thiệu):
cov(x,y)=1n∑i=1n(xi−x¯)(yi−y¯)
để chúng ta thấy rõ rằng mỗi quan sát, , có thể đóng góp tích cực hoặc tiêu cực cho hiệp phương sai, tùy thuộc vào sản phẩm độ lệch của chúng so với giá trị trung bình của hai biến, và . Lưu ý rằng tôi không nói về độ lớn ở đây, mà chỉ đơn giản là dấu hiệu của sự đóng góp của quan sát thứ i.(xi,yi)x¯y¯
Đây là những gì tôi đã mô tả trong các sơ đồ sau. Dữ liệu nhân tạo được tạo bằng mô hình tuyến tính (trái, ; phải, , trong đó được rút ra từ phân phối gaussian với giá trị trung bình bằng 0 và , và từ một phân phối đồng đều trong khoảng ).y=1.2x+εy=0.1x+εεSD=2x[0,20]
Các thanh dọc và ngang tương ứng là giá trị trung bình của và . Điều đó có nghĩa là thay vì "nhìn vào các quan sát riêng lẻ" từ gốc , chúng ta có thể thực hiện từ . Đây chỉ là một bản dịch trên trục x và y. Trong hệ tọa độ mới này, mọi quan sát nằm ở góc phần tư phía trên bên phải hoặc phía dưới bên trái đều đóng góp tích cực vào hiệp phương sai, trong khi các quan sát nằm trong hai góc phần tư khác đóng góp tiêu cực vào nó. Trong trường hợp đầu tiên (bên trái), hiệp phương sai bằng 30,11 và phân phối trong bốn góc phần tư được đưa ra dưới đây:xy(0,0)(x¯,y¯)
+ -
+ 30 2
- 0 28
Rõ ràng, khi các nằm trên giá trị trung bình của chúng, do đó, các tương ứng (wrt. ). Bắt mắt hình dạng của đám mây điểm 2D, khi giá trị tăng giá trị có xu hướng tăng. (Nhưng hãy nhớ rằng chúng ta cũng có thể sử dụng thực tế là có mối quan hệ rõ ràng giữa hiệp phương sai và độ dốc của đường hồi quy, tức là .)xiyiy¯xyb=Cov(x,y)/Var(x)
Trong trường hợp thứ hai (phải, cùng ), hiệp phương sai bằng 3,54 và phân bố trên các góc phần tư là "đồng nhất" hơn như dưới đây:xi
+ -
+ 18 14
- 12 16
Nói cách khác, số trường hợp tăng của và không đồng biến theo cùng một hướng wrt. phương tiện của họ.xiyi
Lưu ý rằng chúng ta có thể giảm hiệp phương sai bằng cách chia tỷ lệ hoặc . Trong bảng điều khiển bên trái, hiệp phương sai của (hoặc ) giảm đi mười lần (3,01). Do các đơn vị đo lường và mức độ lan truyền của và (so với phương tiện của chúng) gây khó khăn cho việc diễn giải giá trị của hiệp phương sai theo thuật ngữ tuyệt đối, chúng tôi thường chia tỷ lệ cả hai biến bằng độ lệch chuẩn của chúng và lấy hệ số tương quan. Điều này có nghĩa là ngoài việc định tâm lại phân tán của chúng tôi thànhy ( x / 10 , y ) ( x , y / 10 ) x y ( x , y ) ( ˉ x , ˉ y ) x yxy(x/10,y)(x,y/10)xy(x,y)(x¯,y¯)chúng tôi cũng chia tỷ lệ đơn vị x và y theo độ lệch chuẩn, dẫn đến một phép đo dễ hiểu hơn về sự cộng hưởng tuyến tính giữa và .xy