câu hỏi này bắt đầu là " Phân cụm dữ liệu không gian trong R " và bây giờ đã chuyển sang câu hỏi DBSCAN.
Khi trả lời cho câu hỏi đầu tiên, tôi đã tìm kiếm thông tin về DBSCAN và đọc một số tài liệu về. Những câu hỏi mới đã nảy sinh.
DBSCAN yêu cầu một số tham số, một trong số đó là "khoảng cách". Vì dữ liệu của tôi là ba chiều, kinh độ, vĩ độ và nhiệt độ, tôi nên sử dụng "khoảng cách" nào? kích thước nào có liên quan đến khoảng cách đó? Tôi cho rằng nó nên là nhiệt độ. Làm thế nào để tôi tìm thấy khoảng cách tối thiểu như vậy với R?
Một tham số khác là số điểm tối thiểu được neded để tạo thành một cụm. Có phương pháp nào để tìm số đó không? Thật không may, tôi đã không tìm thấy.
Tìm kiếm thorugh Google Tôi không thể tìm thấy ví dụ R để sử dụng dbscan trong bộ dữ liệu tương tự như của tôi, bạn có biết trang web nào có loại ví dụ như vậy không? Vì vậy, tôi có thể đọc và cố gắng thích nghi với trường hợp của tôi.
Câu hỏi cuối cùng là lần thử R đầu tiên của tôi với DBSCAN (không có câu trả lời thích hợp cho các câu hỏi trước) đã dẫn đến một vấn đề về bộ nhớ. R nói rằng nó không thể phân bổ vector. Tôi bắt đầu với lưới cách nhau 4 km với 779191 điểm kết thúc ở khoảng 300000 hàng x 3 cột (vĩ độ, kinh độ và nhiệt độ) khi xóa các điểm SST không hợp lệ. Bất kỳ gợi ý để giải quyết vấn đề bộ nhớ này. Nó phụ thuộc vào máy tính của tôi hoặc trong chính DBSCAN?
Cảm ơn sự kiên nhẫn để đọc một tin nhắn dài và có lẽ nhàm chán và sự giúp đỡ của bạn.