So sánh hai biểu đồ sử dụng khoảng cách Chi-Square


18

Tôi muốn so sánh hai hình ảnh của khuôn mặt. Tôi đã tính toán biểu đồ LBP của họ. Vì vậy, bây giờ tôi cần so sánh hai biểu đồ này và nhận được một cái gì đó sẽ cho biết bao nhiêu biểu đồ này bằng nhau (0 - 100%).

Có nhiều cách để giải quyết nhiệm vụ này, nhưng các tác giả của phương pháp LBP nhấn mạnh (Mô tả khuôn mặt với các mẫu nhị phân cục bộ: Ứng dụng để nhận diện khuôn mặt. 2004) rằng khoảng cách Chi-Square tốt hơn so với giao lộ Biểu đồ và thống kê khả năng đăng nhập.

Các tác giả cũng cho thấy một công thức của khoảng cách Chi-Square:

i=1n(xiyi)2(xi+yi)

Trong đó là số thùng, x i là giá trị của thùng thứ nhất,nxi là giá trị của thùng thứ hai.yi

Trong một số nghiên cứu (ví dụ Gia đình khoảng cách biểu đồ bậc hai) tôi thấy rằng công thức của khoảng cách Chi-Square là:

12i=1n(xiyi)2(xi+yi)

Và ở đó http://www.itl.nist.gov/div898/handbook/eda/section3/eda35f.htm Tôi thấy rằng công thức của khoảng cách Chi-Square là:

i=1n(xiyi)2yi

Tôi mắc kẹt với nó. Tôi có một số câu hỏi:

  1. Tôi nên sử dụng biểu thức nào?
  2. Làm thế nào tôi nên giải thích một kết quả của sự khác biệt? Tôi biết rằng sự khác biệt bằng 0 có nghĩa là cả hai biểu đồ đều bằng nhau, nhưng làm sao tôi biết khi nào cả hai biểu đồ hoàn toàn khác nhau? Tôi có cần sử dụng bảng Chi-Square cho nó không? Hay tôi cần sử dụng một ngưỡng? Về cơ bản tôi muốn ánh xạ sự khác biệt đến phần trăm.
  3. Tại sao ba biểu thức này khác nhau?

Có phải yi không phải là giá trị của cùng một thùng với xi mà trong phân phối so sánh, chứ không phải là thùng thứ hai?
ReneBt

Câu trả lời:


7

@Silverfish đã yêu cầu mở rộng câu trả lời của PolatAlemdar, không được đưa ra, vì vậy tôi sẽ cố gắng mở rộng về nó ở đây.

Tại sao tên chisapes khoảng cách? Các thử nghiệm chisquare cho các bảng ngẫu nhiên dựa trên nên ý tưởng này là để giữ cho hình thức này và sử dụng nó như một biện pháp khoảng cách. Điều này đưa ra công thức thứ ba của OP, vớixi đượchiểu là quan sát vàyilà kỳ vọng, điều này giải thích nhận xét của PolatAlemdar "Nó được sử dụng trong các phân phối xác suất rời rạc", ví dụ như trong kiểm tra mức độ phù hợp. Dạng thứ ba nàykhông phảilà hàm khoảng cách, vì nó không đối xứng trong các biếnxy. Để so sánh biểu đồ, chúng ta sẽ muốn một hàm khoảng cách đối xứng trongx

χ2=cells(OiEi)2Ei
xiyixyx , và hai dạng đầu tiên đưa ra điều này. Sự khác biệt giữa chúng chỉ là một yếu tố không đổi 1y , không quan trọng miễn là bạn chỉ chọn một hình thức một cách nhất quán (mặc dù phiên bản có thêm yếu tố112 là tốt hơn nếu bạn muốn so sánh với hình thức bất đối xứng). Lưu ý sự tương đồng trong các công thức này với khoảng cách euclide bình phương, đó không phải là sự trùng hợp ngẫu nhiên, khoảng cách chisapes là một loạikhoảng cách euclidecó trọng số. Vì lý do đó, các công thức trong OP thường được đặt dưới dấu gốc để cókhoảng cách12 . Sau đây chúng tôi làm theo điều này.

Khoảng cách Chisapes cũng được sử dụng trong phân tích tương ứng. Để xem mối quan hệ với biểu mẫu được sử dụng ở đó, hãy là các ô của bảng dự phòng với các hàng R và cột C. Biểu thị tổng số hàng được x + j = Σ i x i j và tổng số cột bằng x i + = Σ j x i j . Khoảng cách các chisquare giữa các hàng l , k được cho bởi χ 2 ( l , k ) xijRCx+j=ixijxi+=jxijl,k Đối với trường hợp chỉ có hai hàng (hai biểu đồ), chúng sẽ phục hồi công thức đầu tiên của OP (modulo dấu gốc).

χ2(l,k)=j1x+j(xljxl+xkjxk+)2
EDIT

Trả lời câu hỏi trong các bình luận bên dưới: Một cuốn sách với các cuộc thảo luận dài về khoảng cách chisapes là "PHÂN TÍCH L CORNH VỰC trong THỰC HÀNH (Ấn bản thứ hai)" của Michael Greenacre (Chapman & Hall). Nó là một cái tên được thiết lập tốt, xuất phát từ sự tương đồng với chisapes như được sử dụng với các bảng dự phòng. Nó có phân phối gì? Tôi chưa bao giờ nghiên cứu điều đó, nhưng có lẽ (trong một số điều kiện ...) nó sẽ có một số phân phối chisapes, xấp xỉ. Bằng chứng phải giống với những gì được thực hiện với các bảng dự phòng, hầu hết các tài liệu về phân tích tương ứng không đi vào lý thuyết phân phối. Một bài báo có một số, có thể liên quan đến lý thuyết như vậy là http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0101-74382016000100023 . Cũng thấy/stats//search?q=%22chisapes+distance%22 cho một số bài viết có liên quan khác trên trang web này.


Tôi có thể hỏi tại sao phương trình cuối cùng của bạn được gọi là khoảng cách chisapes? Được phân phối như vậy? Bạn có thể cung cấp một dẫn xuất xin vui lòng, hoặc một liên kết đến một? Tôi dường như không thể tìm thấy một.
LeastSquaresWonderer

1
Xem các chỉnh sửa của tôi ở trên.
kjetil b halvorsen

3

Tôi thấy liên kết này khá hữu ích: http://docs.opencv.org/2.4/doc/tutorials/imgproc/histograms/histogram_comparison/histogram_comparison.html

Tôi không chắc tại sao, nhưng OpenCV sử dụng công thức thứ 3 mà bạn liệt kê để so sánh biểu đồ Chi-Square.

Về ý nghĩa, tôi không chắc chắn bất kỳ thuật toán đo lường nào sẽ cung cấp cho bạn một phạm vi giới hạn, như 0% đến 100%. Nói cách khác, bạn có thể chắc chắn rằng hai hình ảnh giống nhau: giá trị tương quan là 1 hoặc giá trị chi bình phương là 0,0; nhưng thật khó để đặt giới hạn cho hai hình ảnh khác nhau như thế nào: hãy tưởng tượng so sánh một hình ảnh hoàn toàn trắng với một hình ảnh hoàn toàn đen, giá trị số sẽ là Vô cực hoặc có thể là Không phải là Số.


2

xy

Hai cái còn lại được sử dụng để tính toán độ tương đồng của biểu đồ.


1
$x$xví dụ.
Cá bạc

2
Bạn cần giải thích theo nghĩa thứ ba là đối xứng trong xyvì nó không giống như vậy
mdewey

0

Theo yêu cầu của OP, giá trị tính theo tỷ lệ phần trăm (cho phương trình 1):

p= =χ*S*100N

Ở đâu: p là tỷ lệ phần trăm chênh lệch (0..100). χ là kết quả của phương trình 1. N là số thùng trong biểu đồ. S là giá trị tối đa có thể có trong thùng.

Bổ sung theo yêu cầu:

Tính toán phương trình này người ta có thể có tỷ lệ phần trăm chênh lệch từ biểu đồ đầy đủ. Tính toán này cho cả hai biểu đồ và sau đó trừ đi một biểu đồ khác, người ta có thể có sự khác biệt về tỷ lệ phần trăm.


2
Tôi có một thời gian khó khăn để xem làm thế nào đây là một câu trả lời cho bất kỳ câu hỏi. Bạn có thể xây dựng?
The Laconic

Điều này sẽ cho (tính theo tỷ lệ phần trăm, theo yêu cầu) mức độ khác nhau của một biểu đồ so với biểu đồ đầy đủ. Nếu bạn tính toán phương trình này từ cả hai biểu đồ, chúng ta sẽ biết sự khác biệt giữa cái này với cái khác vì cái này được sử dụng cho tam giác.
Carlos Barcellos
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.