Khoảng cách tương quan so với thông tin lẫn nhau


15

Tôi đã làm việc với các thông tin lẫn nhau trong một thời gian. Nhưng tôi đã tìm thấy một biện pháp gần đây trong "thế giới tương quan" cũng có thể được sử dụng để đo lường sự độc lập phân phối, cái gọi là "tương quan khoảng cách" (còn gọi là tương quan Brownian): http://en.wikipedia.org/wiki/Brownian_covariance . Tôi đã kiểm tra các giấy tờ nơi biện pháp này được giới thiệu, nhưng không tìm thấy bất kỳ sự ám chỉ nào đến thông tin lẫn nhau.

Vì vậy, câu hỏi của tôi là:

  • Họ có giải quyết chính xác cùng một vấn đề? Nếu không, làm thế nào các vấn đề là khác nhau?
  • Và nếu câu hỏi trước có thể được trả lời theo hướng tích cực, những lợi thế của việc sử dụng cái này hay cái kia là gì?

Cố gắng viết rõ ràng 'tương quan khoảng cách' và 'thông tin lẫn nhau' cho một ví dụ đơn giản. Trong trường hợp thứ hai, bạn sẽ nhận được logarit, trong khi trong trường hợp thứ nhất - không.
Piotr Migdal

@PiotrMigdal Vâng, tôi biết sự khác biệt đó. Bạn có thể vui lòng giải thích tại sao nó quan trọng? Xin vui lòng, đưa vào tài khoản mà tôi không phải là một nhà thống kê ...
Dsign

Đối với ma, một công cụ tiêu chuẩn đo lường sự phụ thuộc lẫn nhau của phân phối xác suất là thông tin lẫn nhau. Nó có rất nhiều tính chất tốt đẹp và sự giải thích của nó rất đơn giản. Tuy nhiên, có thể có những vấn đề cụ thể trong đó tương quan khoảng cách được ưa thích (nhưng tôi chưa bao giờ sử dụng nó trong cuộc sống của tôi). Vì vậy, vấn đề bạn đang cố gắng giải quyết là gì?
Piotr Migdal

2
Nhận xét này chậm một vài năm nhưng Phòng Thống kê của Đại học Columbia đã biến năm học 2013-2014 thành một năm tập trung vào các biện pháp phụ thuộc. Vào tháng 4-tháng 5 năm 2014, một hội thảo đã được tổ chức tập hợp các học giả hàng đầu làm việc trong lĩnh vực này bao gồm Anh em Reshef (MIC), Gabor Szekely (tương quan khoảng cách), Subhadeep Mukhopadhay để kể tên một vài người. Đây là một liên kết đến chương trình bao gồm nhiều pdf từ các bài thuyết trình. lệ thuộc2013.wikischologists.columbia.edu / từ
Mike Hunter

Câu trả lời:


9

Thông tin / thông tin lẫn nhau không phụ thuộc vào các giá trị có thể, nó chỉ phụ thuộc vào xác suất do đó nó ít nhạy cảm hơn. Tương quan khoảng cách là mạnh mẽ hơn và đơn giản hơn để tính toán. Để so sánh xem

http://www-stat.stanford.edu/~tibs/reshef/comment.pdf


2
Chào, cảm ơn cho câu trả lời của bạn! Bài báo mà bạn đề cập là về MIC, mà tôi tin là nhiều hơn MI một chút. Tôi đã thực hiện phép đo tương quan khoảng cách và tôi không nghĩ nó đơn giản hơn MI cho trường hợp nguyên tố của các biến phân loại rời rạc. Sau đó, một điều nữa mà tôi đã học được là DCM được xác định rõ và hoạt động tốt đối với các biến liên tục, nhưng với MI, bạn cần thực hiện việc tạo thùng hoặc các công cụ ưa thích ala MIC.
DSign

3
Tuy nhiên, DCM dường như cần ma trận vuông có cạnh là số lượng mẫu. Nói cách khác, độ phức tạp không gian quy mô bậc hai. Hoặc ít nhất đó là ấn tượng của tôi, tôi muốn có một sai lầm. MIC làm tốt hơn, bởi vì bạn có thể điều chỉnh nó theo một số thỏa hiệp giữa độ chính xác và hiệu suất.
DSign
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.