Phân cụm với các thước đo khoảng cách không đối xứng


9

Làm thế nào để bạn phân cụm một tính năng với một thước đo khoảng cách không đối xứng?

Ví dụ: giả sử bạn đang phân cụm một tập dữ liệu với các ngày trong tuần như một tính năng - khoảng cách từ thứ Hai đến thứ Sáu không giống với khoảng cách từ thứ Sáu đến thứ Hai.

Làm thế nào để bạn kết hợp điều này vào thước đo khoảng cách của thuật toán phân cụm?

Câu trả lời:


3

Nếu khoảng cách MF không đối xứng vì tương lai khác với quá khứ, thì một cụm không đối xứng chính hãng được yêu cầu. Đầu tiên, một hàm khoảng cách không đối xứng phải được xác định.

Một cách để phân cụm không đối xứng, được cung cấp một hàm khoảng cách, là nhúng dữ liệu gốc vào một không gian tọa độ mới. Xem "Cấu trúc hình học của một số mô hình không khoảng cách cho MDS bất đối xứng" của Naohito Chino và Kenichi Shiraiwa, Behaviormetrika, 1992 ( pdf ). Đây được gọi là HCM (Mô hình Canonical Hermiti).

Tìm ma trận Hermiti , trong đó Tìm các giá trị riêng và hàm riêng, sau đó chia tỷ lệ cho mỗi hàm riêng theo căn bậc hai của giá trị riêng tương ứng của nó.H i j = 1H

Hij=12[d(xi,xj)+d(xj,xi)]+i12[d(xi,xj)d(xj,xi)]

Điều này biến đổi dữ liệu thành một không gian của các số phức. Sau khi dữ liệu được nhúng, khoảng cách giữa các đối tượng x và y chỉ là x * y, trong đó * là chuyển vị liên hợp. Tại thời điểm này, bạn có thể chạy phương tiện k trên các vectơ phức tạp.

Phân cụm không đối xứng quang phổ cũng đã được thực hiện, xem luận án của Stefan Emilov Atev, "Sử dụng tính không đối xứng trong cụm quỹ đạo quang phổ", Đại học Minnesota, 2011, đưa ra mã MATLAB cho một thuật toán đặc biệt.


1

Bạn có thể lấy một số loại trung bình (như trung bình số học hoặc, để phân phối xác suất, căn bậc hai của phân kỳ Jensen của Shannon.)


1

Bạn nên xem số liệu thống kê vòng tròn (nếu bạn muốn làm việc "trong" một tuần điều chỉnh)


1

Nếu hàm khoảng cách của bạn không phải là hạt nhân Mercer hợp lệ, thì , trong đó là ma trận Gram. Trong trường hợp này muốn co-clustering, còn được gọi là bi-clustering. Các thuật toán của lớp này tạo ra các chỉ báo cụm đồng thời cho các hàng và cột. XXXTX

Ví dụ bạn đưa ra là kết quả của một thước đo khoảng cách được chọn kém. Một số liệu khoảng cách tốt hơn sẽ là|days apart|

Nói chung, chức năng khoảng cách của bạn phải là một hạt nhân Mercer hợp lệ. Một Mercer hạt nhân hợp lệ là bất kỳ chức năng chụp hai quan sát đó là liên tục, đối xứng và có một hiệp phương sai tích cực nhất định ma trận .xD

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.