Tôi có một bộ dữ liệu hàng tháng về nhiệt độ mặt nước biển (SST) và tôi muốn áp dụng một số phương pháp cụm để phát hiện các vùng có mẫu SST tương tự. Tôi có một tập hợp các tệp dữ liệu hàng tháng chạy từ năm 1985 đến năm 2009 và muốn áp dụng phân cụm cho mỗi tháng như một bước đầu tiên.
Mỗi tệp chứa dữ liệu có lưới cho 358416 điểm trong đó khoảng 50% là đất và được đánh dấu bằng giá trị 99,99 sẽ là NA. Định dạng dữ liệu là:
lon lat sst
-10.042 44.979 12.38
-9.998 44.979 12.69
-9.954 44.979 12.90
-9.910 44.979 12.90
-9.866 44.979 12.54
-9.822 44.979 12.37
-9.778 44.979 12.37
-9.734 44.979 12.51
-9.690 44.979 12.39
-9.646 44.979 12.36
Tôi đã thử phương pháp phân cụm CLARA và nhận được một số kết quả rõ ràng nhưng đối với tôi, đó chỉ là cách ly (nhóm). Sau đó, tôi không chắc đây là phương pháp phân cụm tốt nhất để phân tích dữ liệu không gian.
Có phương pháp phân cụm nào khác dành cho loại bộ dữ liệu này không? Một số tài liệu tham khảo sẽ là tốt để bắt đầu đọc.
Cảm ơn trước.