Tôi đang tìm kiếm một số thuật ngữ tốt để mô tả những gì tôi đang cố gắng làm, để tìm kiếm tài nguyên dễ dàng hơn.
Vì vậy, giả sử tôi có hai cụm điểm A và B, mỗi cụm được liên kết với hai giá trị X và Y và tôi muốn đo "khoảng cách" giữa A và B - nghĩa là có khả năng chúng được lấy mẫu từ cùng một phân phối (Tôi có thể giả định rằng các bản phân phối là bình thường). Ví dụ: nếu X và Y tương quan trong A nhưng không tương ứng trong B, thì các bản phân phối là khác nhau.
Theo trực giác, tôi sẽ nhận được ma trận hiệp phương sai của A, và sau đó xem khả năng mỗi điểm trong B có thể phù hợp ở đó và ngược lại (có thể sử dụng khoảng cách như khoảng cách Mahalanobis).
Nhưng đó là một chút "đặc biệt" và có lẽ có một cách mô tả chặt chẽ hơn về điều này (tất nhiên, trong thực tế, tôi có nhiều hơn hai bộ dữ liệu với nhiều hơn hai biến - tôi đang cố gắng xác định bộ dữ liệu nào của mình là những ngoại lệ).
Cảm ơn!