Đo khoảng cách trên mạng giữa hai phân phối đa biến


28

Tôi đang tìm kiếm một số thuật ngữ tốt để mô tả những gì tôi đang cố gắng làm, để tìm kiếm tài nguyên dễ dàng hơn.

Vì vậy, giả sử tôi có hai cụm điểm A và B, mỗi cụm được liên kết với hai giá trị X và Y và tôi muốn đo "khoảng cách" giữa A và B - nghĩa là có khả năng chúng được lấy mẫu từ cùng một phân phối (Tôi có thể giả định rằng các bản phân phối là bình thường). Ví dụ: nếu X và Y tương quan trong A nhưng không tương ứng trong B, thì các bản phân phối là khác nhau.

Theo trực giác, tôi sẽ nhận được ma trận hiệp phương sai của A, và sau đó xem khả năng mỗi điểm trong B có thể phù hợp ở đó và ngược lại (có thể sử dụng khoảng cách như khoảng cách Mahalanobis).

Nhưng đó là một chút "đặc biệt" và có lẽ có một cách mô tả chặt chẽ hơn về điều này (tất nhiên, trong thực tế, tôi có nhiều hơn hai bộ dữ liệu với nhiều hơn hai biến - tôi đang cố gắng xác định bộ dữ liệu nào của mình là những ngoại lệ).

Cảm ơn!


Không biết tại sao, nhưng một bài kiểm tra Thần chú lóe lên trước mắt tôi khi tôi đọc bài viết của bạn.
Roman Luštrik

Câu trả lời:



16

Hmm, khoảng cách Bhattacharyya dường như là thứ tôi đang tìm kiếm, mặc dù khoảng cách Hellinger cũng hoạt động.


bạn đề cập đến Bhattacharyya và Helling sau đó chấp nhận câu trả lời nói về KL ... Cuối cùng, lựa chọn của bạn là gì và tại sao?
Simon C.

1
Tôi tin rằng đó là sự khác biệt của KL, nhưng ... đó là vào năm 2010 và trí nhớ của tôi không hoàn hảo.
Emile

ahah vâng tôi đoán vậy, nhưng dù sao cũng cảm ơn bạn!
Simon C.

9

Heuristic

  • Dạng chồn
  • Trọng số-trung bình-phương sai (WMV)

Thống kê kiểm tra không tham số

  • 2 (Quảng trường Chi)
  • Kolmogorov-Smirnov (KS)
  • Cramer / von Mise (CvM)

Phân kỳ lý thuyết thông tin

  • Kullback-Liebler (KL)
  • Sự khác biệt của JensenTHER Shannon (số liệu)
  • Jeffrey-phân kỳ (ổn định về số lượng và đối xứng)

Đo khoảng cách mặt đất

  • Biểu đồ giao lộ
  • Dạng bậc hai (QF)
  • Khoảng cách Movers Trái đất (EMD)


0

Một số biện pháp khác của "Sự khác biệt thống kê"

  • Kiểm tra hoán vị (bởi Fisher)
  • Định lý giới hạn trung tâm & định lý Slutsky
  • Xét nghiệm Mann-Whitney-Wilcoxin
  • Thử nghiệm người yêu Anderson Anderson
  • Thử nghiệm Shapiro hạ Wilk
  • Bài kiểm tra Lemeshow
  • Bài kiểm tra của Kuiper
  • sự khác biệt của hạt nhân Stein
  • Tương tự Jaccard
  • Ngoài ra, phân cụm phân cấp giao dịch với các biện pháp tương tự giữa các nhóm. Các biện pháp phổ biến nhất của sự tương tự nhóm có lẽ là liên kết đơn, liên kết hoàn chỉnh và liên kết trung bình.
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.