Khoảng cách Mahalanobis là gì và nó được sử dụng như thế nào trong nhận dạng mẫu?


11

Ai đó có thể giải thích cho tôi khái niệm về khoảng cách Mahalanobis? Ví dụ, khoảng cách Mahalanobis giữa hai điểm x và y là gì và đặc biệt, nó được giải thích như thế nào để nhận dạng mẫu?


3
Bạn hiểu gì về nó bây giờ, bất cứ điều gì? Bạn đã thử Wikipedia chưa?
gung - Phục hồi Monica

2
Liên quan rất chặt chẽ: stats.stackexchange.com/questions/62092/ .
whuber

Bạn có thể sử dụng liên kết này. nó mô tả những cũng people.revoledu.com/kardi/tutorial/Similarity/...
Zohreh

Câu trả lời:


13

Khoảng cách Mahalanobis cung cấp một cách để đo mức độ tương tự của một số điều kiện đối với một tập hợp các điều kiện đã biết. Nó tính hiệp phương sai giữa các biến.

Nó được tính như sau: trong đó:

D2=(xm)TC1(xm)
D2=Mahalanobis distancex=Vector of datam=Vector of mean values of independent variablesC1=Inverse Covariance matrix of independent variablesT=Indicates vector should be transposed

Đây trang cung cấp một lời giải thích chi tiết (với các ví dụ từ phân tích cảnh quan).


1
cảm ơn, nguồn đã cho tôi một lời giải thích tốt cho sự khởi đầu
ayariga

5

Khoảng cách Mahalanobis được sử dụng để tìm các ngoại lệ trong một tập hợp dữ liệu. Tôi không biết bạn thuộc lĩnh vực nào, nhưng trong tâm lý học, nó được sử dụng để xác định các trường hợp không "phù hợp" với những gì được mong đợi đưa ra các chỉ tiêu cho tập dữ liệu. Ví dụ: nếu mẫu của bạn bao gồm các cá nhân có mức độ trầm cảm thấp và bạn có một hoặc hai cá nhân có mức độ trầm cảm rất cao, thì họ sẽ có khoảng cách Mahalanobis lớn hơn giá trị tới hạn dự kiến. Bạn có thể muốn xóa những trường hợp này nếu chúng rất cực VÀ nếu bạn cảm thấy rằng chúng không phù hợp với tập dữ liệu của bạn. (Sử dụng ví dụ được cung cấp, mẫu của bạn bao gồm các cá nhân có mức độ trầm cảm thấp, do đó một hoặc hai cá nhân có mức độ trầm cảm cao không phù hợp với phần còn lại). Xác định các ngoại lệ là rất quan trọng vì nhiều phân tích thống kê có "giả định về tính quy tắc" tức là kỳ vọng rằng dữ liệu của bạn được phân phối bình thường. Các ngoại lệ cũng có thể đóng góp vào dữ liệu sai lệch và vì lý do này, chúng cũng nên được xóa. (Trừ khi bạn chuyển đổi toàn bộ biến và điều này sẽ sửa sai). Nhiều chương trình thống kê như SPSS cho phép bạn tính khoảng cách M và xác suất liên quan đến từng điểm để xác định các ngoại lệ. Tôi có thể cung cấp cho bạn các hướng dẫn SPSS, nhưng tôi không biết nếu bạn đang sử dụng SPSS. (Trừ khi bạn chuyển đổi toàn bộ biến và điều này sẽ sửa sai). Nhiều chương trình thống kê như SPSS cho phép bạn tính khoảng cách M và xác suất liên quan đến từng điểm để xác định các ngoại lệ. Tôi có thể cung cấp cho bạn các hướng dẫn SPSS, nhưng tôi không biết nếu bạn đang sử dụng SPSS. (Trừ khi bạn chuyển đổi toàn bộ biến và điều này sẽ sửa sai). Nhiều chương trình thống kê như SPSS cho phép bạn tính khoảng cách M và xác suất liên quan đến từng điểm để xác định các ngoại lệ. Tôi có thể cung cấp cho bạn các hướng dẫn SPSS, nhưng tôi không biết nếu bạn đang sử dụng SPSS.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.