Đo khoảng cách tốt nhất để sử dụng


12

Bối cảnh

Tôi có hai bộ dữ liệu mà tôi muốn so sánh. Mỗi phần tử dữ liệu trong cả hai tập hợp là một vectơ chứa 22 góc (tất cả nằm giữa ππ ). Các góc liên quan đến một cấu hình tư thế con người nhất định, do đó, một tư thế được xác định bởi 22 góc khớp.

Điều cuối cùng tôi đang cố gắng làm là xác định "sự gần gũi" của hai bộ dữ liệu. Vì vậy, với mỗi tư thế (vectơ 22D) trong một bộ, tôi muốn tìm hàng xóm gần nhất của nó trong bộ kia và tạo một khoảng cách cho mỗi cặp gần nhất.

Câu hỏi

  • Tôi chỉ có thể sử dụng khoảng cách Euclide?
    • Để có ý nghĩa, tôi giả sử rằng chỉ số khoảng cách sẽ cần phải được định nghĩa là: , nơi | . . . | là giá trị tuyệt đối và mod là modulo. Sau đó sử dụng kết quả 22 thetas, tôi có thể thực hiện các tính toán khoảng cách Euclide chuẩn,θ=|θ1θ2|modπ|...| .t12+t22++t222
    • Điều này có đúng không?
  • Liệu một số liệu khoảng cách khác sẽ hữu ích hơn, chẳng hạn như chi-vuông, hoặc Bhattacharyya, hoặc một số số liệu khác? Nếu vậy, bạn có thể vui lòng cung cấp một số cái nhìn sâu sắc về lý do tại sao.

3
Như một lưu ý phụ: Tôi không nghĩ bạn có nghĩa là . Thay vào đó là một cái gì đó như min { | θ 1 - θ 2 | , 2 π - | θ 1 - θ 2 | } . |θ1θ2|modπmin{|θ1θ2|,2π|θ1θ2|}
Erik P.

4
Thay vì làm việc với các góc, tôi khuyên bạn nên chuyển đổi sang (x, y) - phối hợp trên vòng tròn đơn vị trước. Sau đó, bạn có thể tính toán bình thường (khoảng cách và tương tự) và tính trung bình không phải là vấn đề như với các góc.
caracal

2
Gợi ý của @Josh Erik P. là một ý kiến ​​hay. Ngoài ra, xem xét từng góc là một điểm ( cos ( θ ) , sin ( θ ) ) trên vòng tròn đơn vị và tính toán khoảng cách Euclide giữa chúng bằng cách sử dụng thông thường (Pythagore) công thức. Sự khác biệt giữa những khoảng cách này và khoảng cách góc không quan trọng. (Tôi tin rằng đây cũng có thể là những gì Caracal đề xuất.)θ(cos(θ),sin(θ))
whuber

2
@Josh Trung bình của, ví dụ: 7 π / 4π . Trong nhiều trường hợp, điều này không có ý nghĩa và thay vào đó là 0 . Trong trường hợp cụ thể của bạn, điều này có thể không phải là một vấn đề kể từ khi có lẽ khớp con người không có một loạt các chuyển động qua π . Ngoài ra, trong trường hợp của bạn, có thể bạn muốn trung bình đã nói ở trên là π do chuyển động khớp là không theo hướng. @ đề nghị của whuber chính xác là những gì tôi muốn nói. π/47π/4π0ππ
caracal

3
Vấn đề của bạn có thể sẽ trở nên dễ dàng hơn để giải quyết nếu bạn có thể chỉ định hậu quả của việc "hiểu sai". Vì vậy, nếu bạn nói các bộ dữ liệu giống hoặc tương tự nhau, nhưng thực tế chúng không phải là gì, điều gì sẽ xảy ra với bạn? Nó sẽ phụ thuộc vào "làm thế nào sai" quyết định của bạn là? Điều gì sẽ xảy ra nếu bạn khai báo dữ liệu / tư thế khác nhau, nhưng thực tế chúng giống nhau hoặc giống nhau? Mất gì? trả lời những câu hỏi này sẽ giúp xác định những gì quan trọng cho việc so sánh bạn muốn thực hiện. Điều này đảm bảo rằng bạn đang trả lời đúng câu hỏi.
xác suất

Câu trả lời:


5

bạn có thể tính ma trận hiệp phương sai cho mỗi bộ và sau đó tính khoảng cách Hausdorff giữa hai bộ bằng khoảng cách Mahalanobis.

Khoảng cách Mahalanobis là một cách hữu ích để xác định độ tương tự của một mẫu chưa biết được đặt thành mẫu đã biết. Nó khác với khoảng cách Euclide ở chỗ nó tính đến các mối tương quan của tập dữ liệu và là bất biến tỷ lệ.


3

Bạn đang cố gắng làm gì với thông tin hàng xóm gần nhất?

Tôi sẽ trả lời câu hỏi đó, và sau đó so sánh các thước đo khoảng cách khác nhau theo ánh sáng đó.

Ví dụ: giả sử bạn đang cố gắng phân loại các tư thế dựa trên cấu hình khớp và muốn các vectơ chung từ cùng một tư thế gần nhau. Một cách đơn giản để đánh giá sự phù hợp của các số liệu khoảng cách khác nhau là sử dụng từng chỉ số trong phân loại KNN và so sánh độ chính xác ngoài mẫu của từng mô hình kết quả.


2

Điều này nghe có vẻ giống với một ứng dụng nhất định của Truy xuất thông tin (IR). Vài năm trước tôi đã tham dự một buổi nói chuyện về nhận dạng dáng đi nghe có vẻ giống với những gì bạn đang làm. Trong Truy xuất thông tin, "tài liệu" (trong trường hợp của bạn: dữ liệu góc của một người) được so sánh với một số truy vấn (trong trường hợp của bạn có thể là "có một người có dữ liệu góc (.., ..)"). Sau đó, các tài liệu được liệt kê theo thứ tự phù hợp nhất với tài liệu phù hợp với ít nhất. Điều đó, có nghĩa là, một thành phần trung tâm của IR sẽ đặt một tài liệu vào một loại không gian vectơ nào đó (trong trường hợp của bạn: không gian góc) và so sánh nó với một truy vấn cụ thể hoặc tài liệu ví dụ hoặc đo khoảng cách của chúng. (Xem bên dưới.) Nếu bạn có định nghĩa âm thanh về khoảng cách giữa hai vectơ riêng lẻ, tất cả những gì bạn phải làm là đưa ra một thước đo cho khoảng cách của hai bộ dữ liệu. (Theo truyền thống trong IR, khoảng cách trong mô hình không gian vectơ được tính bằng thước đo cosine hoặc khoảng cách Euclide nhưng tôi không nhớ họ đã làm như thế nào trong trường hợp đó.) Trong IR cũng có một cơ chế gọi là "phản hồi liên quan", về mặt khái niệm , hoạt động với khoảng cách của hai bộ tài liệu. Cơ chế đó thường sử dụng thước đo khoảng cách tổng hợp tất cả các khoảng cách riêng giữa tất cả các cặp tài liệu (hoặc trong trường hợp của bạn: vectơ người). Có lẽ đó là sử dụng cho bạn.

Trang sau có một số giấy tờ có vẻ liên quan đến vấn đề của bạn: http://www.mpi-inf.mpg.de/~mmueller/index_publications.html Đặc biệt là trang này http://www.mpi-inf.mpg.de/ ~ mmueller / ấn phẩm / 2006_DemuthRoederMuellerEberhardt_MocapRetr cổSystem_ECIR.pdf có vẻ thú vị. Cuộc nói chuyện của Müller mà tôi đã tham dự đề cập đến các biện pháp tương tự từ Kovar và Gle Rich được gọi là "đám mây điểm" (xem http://portal.acm.org/citation.cfm?id=1186562.1015760&coll=DL&dl=ACM ) và một người được gọi là "tứ phương" . Hy vọng nó giúp.


Nó sẽ hữu ích để có tài liệu tham khảo nếu bạn có thể tìm thấy nó. Cảm ơn.
Josh

2

(xy)tA(xy)AAAA


0

Một vấn đề với việc sử dụng các góc làm proxy cho hình dạng là các nhiễu loạn nhỏ trong các góc có thể dẫn đến nhiễu loạn lớn trong hình. Hơn nữa, các cấu hình góc khác nhau có thể dẫn đến hình dạng giống nhau (hoặc tương tự).

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.