Tôi đã cố gắng thu thập một vài nhận xét về hiệp phương sai dựa trên ấn tượng của tôi từ việc đọc các tài liệu tham khảo được liệt kê dưới đây. Tuy nhiên, tôi không coi mình là một chuyên gia về chủ đề này. Bình luận, sửa chữa, đề xuất, vv đều được chào đón.
Các nhận xét là (mạnh mẽ) thiên về những hạn chế tiềm năng, như được yêu cầu trong câu hỏi ban đầu .
Như tôi thấy, những nhược điểm tiềm năng như sau:
- Phương pháp là mới . Tôi đoán rằng đây là yếu tố lớn nhất liên quan đến sự thiếu phổ biến tại thời điểm này. Các giấy tờ phác thảo khoảng cách hiệp phương sai bắt đầu vào giữa những năm 2000 và tiến tới ngày nay. Bài báo được trích dẫn ở trên là bài nhận được nhiều sự chú ý nhất (cường điệu?) Và nó chưa đầy ba tuổi. Ngược lại, lý thuyết và kết quả về các biện pháp tương quan và tương quan có hơn một thế kỷ làm việc đã đứng sau chúng.
- Các khái niệm cơ bản là thách thức hơn . Mối tương quan thời điểm sản phẩm của Pearson, ở cấp độ hoạt động, có thể được giải thích cho sinh viên năm nhất đại học mà không có nền tảng tính toán khá dễ dàng. Một quan điểm "thuật toán" đơn giản có thể được đặt ra và trực giác hình học rất dễ mô tả. Ngược lại, trong trường hợp hiệp phương sai khoảng cách, ngay cả khái niệm tổng các sản phẩm của khoảng cách Euclide cũng khó khăn hơn một chút và khái niệm hiệp phương sai đối với quá trình ngẫu nhiên vượt xa những gì có thể giải thích một cách hợp lý cho khán giả như vậy .
- Đó là tính toán đòi hỏi nhiều hơn . Thuật toán cơ bản để tính toán thống kê kiểm tra là trong cỡ mẫu trái ngược với cho các số liệu tương quan tiêu chuẩn. Đối với kích thước mẫu nhỏ, đây không phải là vấn đề lớn, nhưng đối với những mẫu lớn hơn, nó trở nên quan trọng hơn.O ( n )Ô ( n2)Ô ( n )
- Thống kê kiểm tra không phân phối miễn phí, thậm chí không có triệu chứng . Người ta có thể hy vọng rằng với một thống kê kiểm tra phù hợp với tất cả các lựa chọn thay thế, thì phân phối, ít nhất là không có triệu chứng, có thể độc lập với các phân phối cơ bản của và theo giả thuyết null. Đây không phải là trường hợp cho hiệp phương sai khoảng cách vì phân phối dưới null phụ thuộc vào phân phối cơ bản của và ngay cả khi kích thước mẫu có xu hướng vô cùng. Đúng là các bản phân phối được giới hạn thống nhất bởi phân phối , cho phép tính toán giá trị tới hạn bảo thủ .Y X Y χ 2 1XYXYχ21
- Mối tương quan khoảng cách là một biến đổi một-một củatrong trường hợp bình thường bivariate| ρ | . Đây không thực sự là một nhược điểm, và thậm chí có thể được xem là một thế mạnh. Nhưng, nếu người ta chấp nhận một xấp xỉ thông thường gần đúng với dữ liệu, có thể khá phổ biến trong thực tế, thì rất ít, nếu có bất cứ điều gì, có được từ việc sử dụng tương quan khoảng cách thay cho các thủ tục tiêu chuẩn.
- Thuộc tính năng lượng không xác định . Việc nhất quán chống lại tất cả các giải pháp thay thế về cơ bản đảm bảo rằng hiệp phương sai khoảng cách phải có sức mạnh rất thấp so với một số lựa chọn thay thế. Trong nhiều trường hợp, một người sẵn sàng từ bỏ tính tổng quát để có được sức mạnh bổ sung chống lại các lựa chọn quan tâm cụ thể. Các bài báo gốc cho thấy một số ví dụ trong đó họ yêu cầu quyền lực cao liên quan đến các số liệu tương quan tiêu chuẩn, nhưng tôi tin rằng, quay trở lại (1.) ở trên, hành vi của nó đối với các lựa chọn thay thế vẫn chưa được hiểu rõ.
Để nhắc lại, câu trả lời này có lẽ đi qua khá tiêu cực. Nhưng, đó không phải là ý định. Có một số ý tưởng rất hay và thú vị liên quan đến hiệp phương sai và sự mới lạ tương đối của nó cũng mở ra con đường nghiên cứu để hiểu nó đầy đủ hơn.
Tài liệu tham khảo :
- GJ Szekely và ML Rizzo (2009), hiệp phương sai khoảng cách Brown , Ann. Táo. Thống kê. , tập 3, không 4, 1236 Vang1265.
- GJ Szekely, ML Rizzo và NK Bakirov (2007), Đo lường và kiểm tra tính độc lập bằng sự tương quan của khoảng cách , Ann. Thống kê. , tập 35, 2769 bóng2794.
- R. Lyons (2012), Hiệp phương sai trong không gian hệ mét ,
Ann. Con mồi (xuất hiện).