Làm thế nào để khoảng cách Gower tính toán sự khác biệt giữa các biến nhị phân '?

Tôi có 17 biến số và 5 biến nhị phân (0-1), với 73 mẫu trong tập dữ liệu của tôi. Tôi cần phải chạy một phân tích cụm. Tôi biết rằng khoảng cách Gower là một số liệu tốt cho các bộ dữ liệu với các biến hỗn hợp. Tuy nhiên, tôi không thể hiểu làm thế nào khoảng cách Gower tính toán sự khác biệt giữa các biến nhị phân . Dường như với tôi rằng nó không khác biệt với khoảng cách Euclide.

clustering distance mixed-type-data

— Emrah Bilgiç
nguồn

Câu hỏi của bạn không khá rõ ràng. Có phải bạn chỉ đang hỏi 'khoảng cách Gower tính toán sự khác biệt giữa các biến nhị phân' như thế nào? "Không có sự khác biệt so với Euclide" nghĩa là gì?

— gung - Phục hồi Monica

Cảm ơn bạn. Xin lỗi, tôi hỏi làm thế nào Gower tính toán sự khác biệt giữa các biến nhị phân. Ý tôi là, tôi không thể hiểu được sự khác biệt btw. Euclide và Gower cho biến nhị phân.

— Emrah Bilgiç

Bạn đã tìm kiếm trang web này cho Gower? stats.stackexchange.com/a/15313/3277

— ttnphns

Có tôi đã làm. Khoảng cách Euclide là 0, nếu cả hai mẫu có cùng giá trị, 1 nếu không. Gower thì sao?

— Emrah Bilgiç

@ EmrahBilgiç, số liệu Gower là tương tự, không phải khoảng cách. Nó trở thành "khoảng cách" khi bị trừ đi 1. Đọc theo liên kết ở trên cách nó xử lý dữ liệu nhị phân.

— ttnphns

Làm thế nào về các thuộc tính nhị phân có các giá trị "m" và "f", cho "nam" và "nữ"?

Bạn có nhận ra rằng đối với một biến số dicotomous, tất cả những gì bạn có thể nhận ra là "giống nhau" hay "khác biệt"? Sự khác biệt điểm chính giữa các khoảng cách không phải là nếu giá trị là 1 hoặc 0; nhưng làm thế nào nhiều biến được kết hợp.

— Có QUIT - Anony-Mousse
nguồn

Khoảng cách Gower sử dụng Manhattan để tính khoảng cách giữa các điểm dữ liệu liên tục và Dice để tính khoảng cách giữa các điểm dữ liệu phân loại

— Sanjeet
nguồn