Tôi đang làm việc trên một số phần mềm sẽ xác định vị trí trong thế giới thực (máy quay tốc độ) từ một số báo cáo dựa trên GPS . Một người dùng sẽ lái xe khi báo cáo vị trí, do đó báo cáo rất không chính xác. Để giải quyết vấn đề đó, tôi phải phân cụm các báo cáo về cùng một vị trí và tính trung bình.
Câu hỏi của tôi là về cách phân cụm các báo cáo . Tôi đã đọc về thuật toán tối đa hóa kỳ vọng và phân cụm k-nghĩa , nhưng theo tôi hiểu, tôi sẽ cần xác định trước số lượng vị trí thực.
Có bất kỳ thuật toán nào khác, không cần số lượng chính xác của các vị trí thực, mà thay vào đó sử dụng một số điều kiện cạnh (khoảng cách tối thiểu)?
Một báo cáo chứa kinh độ , vĩ độ và độ chính xác ( tính bằng mét). Không có tên hoặc bất cứ điều gì khác có thể được sử dụng để xác định các bản sao.
Một trở ngại khác có thể là nó sẽ phổ biến, chỉ có một báo cáo cho một địa điểm trong thế giới thực. Điều đó gây khó khăn cho việc phân biệt các ngoại lệ với dữ liệu tốt.