Khoảng cách Mahalanobis giữa hai phân phối bivariate với hiệp phương sai khác nhau


8

Câu hỏi được chứa khá nhiều trong tiêu đề. Khoảng cách Mahalanobis cho hai phân phối ma trận hiệp phương sai khác nhau là gì? Những gì tôi đã tìm thấy cho đến bây giờ giả sử cùng một hiệp phương sai cho cả hai phân phối, tức là, một cái gì đó thuộc loại này:

ΔTΣ1Δ

Nếu tôi có hai khác nhau Σ s?

Lưu ý: - Vấn đề là ở đây: có hai phân phối bivariate có cùng kích thước nhưng được xoay và dịch đối với nhau (xin lỗi tôi đến từ một nền tảng toán học thuần túy, không phải là một thống kê). Tôi cần phải đo mức độ chồng chéo / khoảng cách của họ.

* Cập nhật: * Điều có thể hoặc không thể ẩn trong những gì tôi đang hỏi là tôi cần một khoảng cách giữa các phương tiện của hai bản phân phối. Tôi biết phương tiện ở đâu, nhưng vì hai phân phối được xoay đối với nhau, tôi cần gán các trọng số khác nhau cho các hướng khác nhau và do đó khoảng cách Euclide đơn giản giữa các phương tiện không hoạt động. Bây giờ, như tôi đã hiểu, khoảng cách Mahalanobis không thể được sử dụng để đo thông tin này nếu các phân phối có hình dạng khác nhau (rõ ràng nó hoạt động với hai phân phối bình thường đa biến của hiệp phương sai giống nhau, nhưng không phải trong trường hợp chung). Có một biện pháp tốt mã hóa mong muốn này để mã hóa các định hướng với các trọng lượng khác nhau?


1
Khoảng cách Mahalanobis không có ý nghĩa khi phân phối khác nhau. (Giống như nói "Peter sống trên một quả cầu và Paul sống trên một mặt phẳng Euclide; làm thế nào để chúng ta tính toán khoảng cách giữa chúng?") Có lẽ bạn có thể lùi lại một bước và giúp chúng tôi hiểu động cơ cho câu hỏi: chính xác thì bạn làm gì muốn thực hiện ở đây? Bối cảnh thống kê là gì?
whuber

Được rồi, tôi đã nghi ngờ rất nhiều. Lý do tại sao tôi hỏi là tôi đã nhìn thấy các phương trình sau đây được sử dụng để tính toán một 'Mahalanobis' khoảng cách, hoặc lâu hơn nó tuyên bố: Tôi không quá chắc chắn rằng của một Khoảng cách Mahalanobis; Tôi chỉ phản ánh những gì đã được tuyên bố. Khoảng cách Bhattacharya sẽ hoạt động tốt hơn ở vị trí của nó?
ΔT\(Σ1Σ2\)1Δ
Kristian D'Amato

@ k-damato Mahalanobis khoảng cách đo khoảng cách giữa các điểm, không phân phối.
vqv

Được rồi, vậy có ai nhận ra phương trình trên là một cái gì đó có ý nghĩa không? Các đồng bằng là các vectơ dịch chuyển.
Kristian D'Amato

@Kristian Tôi đã hợp nhất hai tài khoản trùng lặp của bạn. Vui lòng sử dụng tài khoản đã đăng ký của bạn, kể từ bây giờ.
chl

Câu trả lời:


6

Có nhiều khái niệm về khoảng cách giữa các phân phối xác suất. Cái nào để sử dụng phụ thuộc vào mục tiêu của bạn. Tổng khoảng cách biến đổi là một cách tự nhiên để đo sự chồng chéo giữa các bản phân phối. Nếu bạn đang làm việc với Normals đa biến, Kiverback-Leibler Divergence thuận tiện về mặt toán học. Mặc dù nó không thực sự là một khoảng cách (vì nó không đối xứng và không tuân theo bất đẳng thức tam giác), nhưng nó vượt quá giới hạn tổng khoảng cách - xem Bất đẳng thức của Pinsker .


2
một vài cuộc thảo luận gần đây ở đây đã tập trung vào sửa đổi phân kỳ KL dẫn đến một số liệu thích hợp. Trong trường hợp bạn quan tâm, xem ở đâyở đây .
Đức Hồng Y

3

Giới thiệu Như @vqv đã đề cập Tổng biến thể và Kullback Leibler là hai khoảng cách thú vị. Cái đầu tiên rất có ý nghĩa vì nó có thể liên quan trực tiếp đến lỗi loại thứ nhất và thứ hai trong kiểm tra giả thuyết. Vấn đề với khoảng cách tổng biến thể là nó có thể khó tính toán. Khoảng cách Kullback Leibler dễ dàng tính toán hơn và tôi sẽ đến đó sau. Nó không phải là đối xứng nhưng có thể được thực hiện đối xứng (bằng cách nào đó một chút giả tạo).

LP0,P1i=0,1 PiμiCi

LL2(P1/2)2

cho được chọn tốt .P1/2

Nói một cách đơn giản :

  • có thể có các phép quay "hướng" thú vị khác nhau, thu được bằng cách sử dụng công thức của bạn với một trong các ma trận hiệp phương sai "nội suy" ( hoặc ) ở cuối bài này (số là bài bạn đề xuất trong bình luận cho câu hỏi của bạn). Σ=Ci,1/2i=1,2,3,455
  • do hai phân phối của bạn có hiệp phương sai khác nhau, nên việc so sánh các phương tiện không hiệu quả , bạn cũng cần so sánh hiệp phương sai.

Hãy để tôi giải thích cho bạn lý do tại sao đây là cảm giác của tôi, làm thế nào bạn có thể tính toán điều này trong trường hợp và cách chọn .C1C0P1/2

Trường hợp tuyến tính Nếu .C1=C0=Σ

σ=ΔΣ1Δ=2LL2(P1/2)2

nơi là "Nội suy" giữa và (gaussian với hiệp phương sai và trung bình ). Lưu ý rằng trong trường hợp này, khoảng cách Hellinger, tổng khoảng cách biến thể có thể được viết bằng .P1/2P1P0Σ(μ1+μ0)/2σ

Làm thế nào để tính toán trong trường hợp chungL câu hỏi tự nhiên Một phát sinh từ câu hỏi của bạn (và tôi ) là một "Nội suy" tự nhiên giữa là những gì và khi . Ở đây, từ tự nhiên có thể là từ người dùng cụ thể nhưng ví dụ: từ này có thể liên quan đến phép nội suy tốt nhất để có giới hạn trên chặt chẽ với khoảng cách khác (ví dụ: khoảng cách ở đây )P1P0C1C0L1

Viết ( ) có thể giúp xem đâu là nhiệm vụ nội suy, nhưng:

L=ϕ(Ci1/2(xμi))ϕ(Cj1/2(xμj))12log(CiCj)
i=0,j=1

L(x)=12Aij(xsij),xsijRp+Gij,xsijRpcij,[1]

với

Aij=CiCj,Gij=Sijmij,Sij=Ci+Cj2,
cij=18Aijmij,mijRp+12log|det(CjCi)|

mij=μiμjandsij=μi+μj2

có liên quan nhiều hơn cho mục đích tính toán. Với mọi gaussian với trung bình và hiệp phương sai , phép tính từ phương trình là một chút kỹ thuật nhưng có thể tin được. Bạn cũng có thể sử dụng nó để tính khoảng cách leibler Kulback. s 01 C L 2 L 2 ( P 1 / 2 ) 1P1/2s01CLL2(P1/2)21

Chúng ta nên chọn phép nội suy nào (tức là cách chọn )P1/2 Điều này được hiểu rõ ràng từ phương trình rằng có nhiều ứng cử viên khác nhau cho (nội suy) trong trường hợp "bậc hai". Hai ứng cử viên tôi thấy "tự nhiên nhất" (chủ quan :)) phát sinh từ việc xác định cho một phân phối gaussian với trung bình : P 1 / 2 t[0,1] P t t μ 1 +(1-t) L 01P1/2t[0,1]Pttμ1+(1t)μ0

  1. Pt1 là phân phối của (trong đó được rút ra từ ) có hiệp phương sai ).
    ξt=tξ1+(1t)ξ0
    ξiPi i=0,1Ct,1=(tC11/2+(1t)C01/2)2
  2. C - 1 t , 2 = t C - 1 1 + ( 1 - t ) C - 1 0Pt2 với hiệp phương sai nghịch đảoCt,21=tC11+(1t)C01
  3. C t , 3 = t C 1 + ( 1 - t ) C 0Pt3 với hiệp phương saiCt,3=tC1+(1t)C0
  4. C - 1 t , 4 = ( t C - 1 / 2 1 + ( 1 - t ) C - 1 / 2 0 ) 2Pt4 với hiệp phương sai nghịch đảoCt,41=(tC11/2+(1t)C01/2)2

EDIT: Người bạn đề xuất trong một nhận xét cho câu hỏi của bạn có thể là , tại sao không ...Ct,5=C1tC01t

Tôi có lựa chọn yêu thích không phải là lựa chọn đầu tiên :) không có nhiều thời gian để thảo luận về vấn đề đó ở đây. Có lẽ tôi sẽ chỉnh sửa câu trả lời này sau ...


2

Điều này đã cũ, nhưng đối với những người khác đang đọc điều này, ma trận hiệp phương sai phản ánh sự quay của các phân phối gaussian và giá trị trung bình phản ánh vị trí dịch hoặc vị trí trung tâm của phân phối. Để đánh giá khoảng cách mahab, chỉ cần D = ((m2-m1) * inv ((C1 + C2) / 2) * (m2-m1) '). Bây giờ nếu bạn nghi ngờ rằng hai phân phối bivariate là như nhau, nhưng bạn nghi ngờ rằng chúng đã được xoay, sau đó tính toán hai cặp hàm riêng và giá trị riêng cho mỗi phân phối. Các hàm riêng chỉ theo hướng lan truyền dữ liệu bivariate dọc theo trục chính và trục phụ và giá trị riêng biểu thị độ dài của sự lan truyền này. Nếu các giá trị riêng giống nhau, thì hai phân phối giống nhau nhưng được xoay. Lấy acos của sản phẩm chấm giữa các eigenvector để có được góc quay.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.