Đài thiên văn Nam Âu có các danh mục với dữ liệu hình ảnh có sẵn từ http://www.eso.org/qi/ , bạn sẽ phải đăng ký trước khi có thể truy cập chúng.
Tôi khuyên bạn nên xem các trang web của đài quan sát khác để biết dữ liệu của họ. Bạn sẽ phải xem qua các trang được nhắm mục tiêu chung và tìm liên kết cho dữ liệu hoặc khoa học, hoặc cổng thông tin người dùng hoặc một cái gì đó tương tự. Chúng đôi khi rất khó tìm.
Lý tưởng nhất là bạn sẽ có một tập hợp dữ liệu hình ảnh chú thích tiêu chuẩn để phân loại để bạn có thể so sánh kết quả của mình với người khác. Thật không may, tôi không biết về bất kỳ bộ tiêu chuẩn.
Đối với tài liệu về việc sử dụng nhận dạng mẫu trên các hình ảnh thiên văn, http://astrometry.net/biblio.html là một tài nguyên tốt. Họ đã tạo ra một hệ thống ML không chỉ có thể phân biệt các ngôi sao với các lớp đối tượng khác mà còn có thể xác định những ngôi sao nào có thể nhìn thấy trong một hình ảnh! Nghiên cứu rất thú vị.
NB Để phân loại sao theo cụm, vấn đề có thể không phải là phân loại, mà là phân khúc nhiều hơn.