Đo khoảng cách trên mạng giữa hai phân phối đa biến

28

Tôi đang tìm kiếm một số thuật ngữ tốt để mô tả những gì tôi đang cố gắng làm, để tìm kiếm tài nguyên dễ dàng hơn.

Vì vậy, giả sử tôi có hai cụm điểm A và B, mỗi cụm được liên kết với hai giá trị X và Y và tôi muốn đo "khoảng cách" giữa A và B - nghĩa là có khả năng chúng được lấy mẫu từ cùng một phân phối (Tôi có thể giả định rằng các bản phân phối là bình thường). Ví dụ: nếu X và Y tương quan trong A nhưng không tương ứng trong B, thì các bản phân phối là khác nhau.

Theo trực giác, tôi sẽ nhận được ma trận hiệp phương sai của A, và sau đó xem khả năng mỗi điểm trong B có thể phù hợp ở đó và ngược lại (có thể sử dụng khoảng cách như khoảng cách Mahalanobis).

Nhưng đó là một chút "đặc biệt" và có lẽ có một cách mô tả chặt chẽ hơn về điều này (tất nhiên, trong thực tế, tôi có nhiều hơn hai bộ dữ liệu với nhiều hơn hai biến - tôi đang cố gắng xác định bộ dữ liệu nào của mình là những ngoại lệ).

Cảm ơn!

multivariate-analysis terminology distance-functions

— Emile
nguồn

Không biết tại sao, nhưng một bài kiểm tra Thần chú lóe lên trước mắt tôi khi tôi đọc bài viết của bạn.

— Roman Luštrik

15

Ngoài ra còn có phân kỳ Kullback-Leibler , có liên quan đến Khoảng cách Hellinger mà bạn đề cập ở trên.

— Phục hồi Monica - G. Simpson
nguồn

2

người ta có thể tính được sự phân kỳ của điểm Kullback-Leibler mà không đưa ra giả định về mật độ xác suất cơ bản mà các điểm đến từ đâu không?

— Andre Holzner

16

Hmm, khoảng cách Bhattacharyya dường như là thứ tôi đang tìm kiếm, mặc dù khoảng cách Hellinger cũng hoạt động.

— Emile
nguồn

bạn đề cập đến Bhattacharyya và Helling sau đó chấp nhận câu trả lời nói về KL ... Cuối cùng, lựa chọn của bạn là gì và tại sao?

— Simon C.

1

Tôi tin rằng đó là sự khác biệt của KL, nhưng ... đó là vào năm 2010 và trí nhớ của tôi không hoàn hảo.

— Emile

ahah vâng tôi đoán vậy, nhưng dù sao cũng cảm ơn bạn!

— Simon C.

9

Heuristic

Dạng chồn
Trọng số-trung bình-phương sai (WMV)

Thống kê kiểm tra không tham số

2 (Quảng trường Chi)
Kolmogorov-Smirnov (KS)
Cramer / von Mise (CvM)

Phân kỳ lý thuyết thông tin

Kullback-Liebler (KL)
Sự khác biệt của JensenTHER Shannon (số liệu)
Jeffrey-phân kỳ (ổn định về số lượng và đối xứng)

Đo khoảng cách mặt đất

Biểu đồ giao lộ
Dạng bậc hai (QF)
Khoảng cách Movers Trái đất (EMD)

— cầu cảng
nguồn

7

Khảo sát đầy đủ nhất được cung cấp trong Suy luận thống kê dựa trên các biện pháp phân kỳ của Leandro Pardo, Đại học Complutense, Chapman Hall 2006.

— Đánh dấu cá hồi
nguồn

0

Một số biện pháp khác của "Sự khác biệt thống kê"

Kiểm tra hoán vị (bởi Fisher)
Định lý giới hạn trung tâm & định lý Slutsky
Xét nghiệm Mann-Whitney-Wilcoxin
Thử nghiệm người yêu Anderson Anderson
Thử nghiệm Shapiro hạ Wilk
Bài kiểm tra Lemeshow
Bài kiểm tra của Kuiper
sự khác biệt của hạt nhân Stein
Tương tự Jaccard
Ngoài ra, phân cụm phân cấp giao dịch với các biện pháp tương tự giữa các nhóm. Các biện pháp phổ biến nhất của sự tương tự nhóm có lẽ là liên kết đơn, liên kết hoàn chỉnh và liên kết trung bình.

— Danylo Zherebetskyy
nguồn