Cách tiếp cận đúng và thuật toán phân cụm cho phân cụm định vị địa lý là gì?
Tôi đang sử dụng đoạn mã sau để phân phối vị trí địa lý cụm:
import numpy as np
import matplotlib.pyplot as plt
from scipy.cluster.vq import kmeans2, whiten
coordinates= np.array([
[lat, long],
[lat, long],
...
[lat, long]
])
x, y = kmeans2(whiten(coordinates), 3, iter = 20)
plt.scatter(coordinates[:,0], coordinates[:,1], c=y);
plt.show()
Có đúng không khi sử dụng phương tiện K để phân cụm định vị địa lý, vì nó sử dụng khoảng cách Euclide chứ không phải công thức Haversine như một hàm khoảng cách?