@Silverfish đã yêu cầu mở rộng câu trả lời của PolatAlemdar, không được đưa ra, vì vậy tôi sẽ cố gắng mở rộng về nó ở đây.
Tại sao tên chisapes khoảng cách? Các thử nghiệm chisquare cho các bảng ngẫu nhiên dựa trên
nên ý tưởng này là để giữ cho hình thức này và sử dụng nó như một biện pháp khoảng cách. Điều này đưa ra công thức thứ ba của OP, vớixi đượchiểu là quan sát vàyilà kỳ vọng, điều này giải thích nhận xét của PolatAlemdar "Nó được sử dụng trong các phân phối xác suất rời rạc", ví dụ như trong kiểm tra mức độ phù hợp. Dạng thứ ba nàykhông phảilà hàm khoảng cách, vì nó không đối xứng trong các biếnxvày. Để so sánh biểu đồ, chúng ta sẽ muốn một hàm khoảng cách đối xứng trongxvà
χ2=∑cells(Oi−Ei)2Ei
xiyixyx , và hai dạng đầu tiên đưa ra điều này. Sự khác biệt giữa chúng chỉ là một yếu tố không đổi
1y , không quan trọng miễn là bạn chỉ chọn một hình thức một cách nhất quán (mặc dù phiên bản có thêm yếu tố
112 là tốt hơn nếu bạn muốn so sánh với hình thức bất đối xứng). Lưu ý sự tương đồng trong các công thức này với khoảng cách euclide bình phương, đó không phải là sự trùng hợp ngẫu nhiên, khoảng cách chisapes là một loạikhoảng cách euclide
có trọng số. Vì lý do đó, các công thức trong OP thường được đặt dưới dấu gốc để có
khoảng cách12 . Sau đây chúng tôi làm theo điều này.
Khoảng cách Chisapes cũng được sử dụng trong phân tích tương ứng. Để xem mối quan hệ với biểu mẫu được sử dụng ở đó, hãy là các ô của bảng dự phòng với các hàng R và cột C. Biểu thị tổng số hàng được x + j = Σ i x i j và tổng số cột bằng x i + = Σ j x i j . Khoảng cách các chisquare giữa các hàng l , k được cho bởi
χ 2 ( l , k ) √xijRCx+j=∑ixijxi+=∑jxijl,k
Đối với trường hợp chỉ có hai hàng (hai biểu đồ), chúng sẽ phục hồi công thức đầu tiên của OP (modulo dấu gốc).
χ2(l,k)=∑j1x+j(xljxl+−xkjxk+)2−−−−−−−−−−−−−−−−−−−⎷
EDIT
Trả lời câu hỏi trong các bình luận bên dưới: Một cuốn sách với các cuộc thảo luận dài về khoảng cách chisapes là "PHÂN TÍCH L CORNH VỰC trong THỰC HÀNH (Ấn bản thứ hai)" của Michael Greenacre (Chapman & Hall). Nó là một cái tên được thiết lập tốt, xuất phát từ sự tương đồng với chisapes như được sử dụng với các bảng dự phòng. Nó có phân phối gì? Tôi chưa bao giờ nghiên cứu điều đó, nhưng có lẽ (trong một số điều kiện ...) nó sẽ có một số phân phối chisapes, xấp xỉ. Bằng chứng phải giống với những gì được thực hiện với các bảng dự phòng, hầu hết các tài liệu về phân tích tương ứng không đi vào lý thuyết phân phối. Một bài báo có một số, có thể liên quan đến lý thuyết như vậy là http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0101-74382016000100023 . Cũng thấy/stats//search?q=%22chisapes+distance%22 cho một số bài viết có liên quan khác trên trang web này.