Câu trả lời này của tôi không trả lời chính xác câu hỏi. Xin vui lòng đọc các ý kiến.
Chúng ta hãy so sánh hiệp phương sai thông thường và hiệp phương sai khoảng cách . Phần hiệu quả của cả hai là tử số của họ. (Mẫu số chỉ đơn giản là trung bình.) Tử số của hiệp phương sai là tóm tắt chéo sản phẩm (= sản phẩm vô hướng) của độ lệch từ một điểm, giá trị trung bình: (với superscripted μ như trọng tâm đó). Để viết lại biểu hiện trong phong cách này: Σ d x i μ d y i μ , với dΣ(xi−μx)(yi−μy)μΣdxiμdyiμdđại diện cho độ lệch của điểm từ tâm, tức là khoảng cách (đã ký) của nó đến tâm. Hiệp phương sai được xác định bằng tổng các sản phẩm của hai khoảng cách trên tất cả các điểm.i
Làm thế nào mọi thứ với hiệp phương sai khoảng cách ? Tử số là, như bạn biết, . Nó không giống với những gì chúng ta đã viết ở trên sao? Và sự khác biệt là gì? Ở đây, khoảng cách d là giữa các điểm dữ liệu khác nhau , không phải giữa điểm dữ liệu và giá trị trung bình như trên. Hiệp phương sai khoảng cách được xác định bằng tổng các tích của hai khoảng cách trên tất cả các cặp điểm.Σdxijdyijd
Sản phẩm vô hướng (giữa hai thực thể - trong trường hợp của chúng tôi, các biến và y ) dựa trên khoảng cách đồng từ một điểm cố định được tối đa hóa khi dữ liệu được sắp xếp dọc theo một đường thẳng . Sản phẩm vô hướng dựa trên khoảng cách đồng từ điểm var * i * có thể được tối đa hóa khi dữ liệu được sắp xếp dọc theo một đường thẳng cục bộ, chính xác; nói cách khác, khi tổng thể dữ liệu đại diện cho chuỗi bất kỳ hình dạng nào , sự phụ thuộc của bất kỳ hình dạng nào.xy
Và thực tế, hiệp phương sai thông thường sẽ lớn hơn khi mối quan hệ gần với tuyến tính hoàn hảo hơn và phương sai lớn hơn. Nếu bạn chuẩn hóa các phương sai thành một đơn vị cố định, hiệp phương sai chỉ phụ thuộc vào độ mạnh của liên kết tuyến tính, và sau đó nó được gọi là tương quan Pearson . Và, như chúng ta đã biết - và chỉ cần có một số trực giác tại sao - hiệp phương sai khoảng cách lớn hơn khi mối quan hệ gần với đường cong hoàn hảo và chênh lệch dữ liệu lớn hơn. Nếu bạn tiêu chuẩn hóa các mức chênh lệch thành một đơn vị cố định, hiệp phương sai chỉ phụ thuộc vào độ mạnh của một số liên kết đường cong, và sau đó nó được gọi là tương quan Brownian (khoảng cách) .