Mặc dù số tiền đặt cược cao hơn Project Euler, như bạn đã chỉ ra, Kaggle là một nguồn dữ liệu tuyệt vời để sử dụng trong các thử nghiệm của riêng bạn. Nhiều cuộc thi của họ yêu cầu bạn phải đăng nhập để truy cập vào bộ dữ liệu (đối với các thỏa thuận pháp lý và vv), nhưng nếu bạn không thực sự hoàn thành một mục, tôi sẽ không bị phạt.
Điều đó đang được nói, nếu bạn tìm kiếm các bộ dữ liệu cụ thể để kiểm tra các quy trình thống kê, như các bộ dữ liệu tại Princeton , bạn có thể kiểm tra dữ liệu trên các kiến trúc mạng khác nhau và so sánh nó với hồi quy đơn giản, v.v. làm chuẩn.
Xem thêm tại đây để biết danh sách toàn diện, bao gồm tất cả dữ liệu xử lý ngôn ngữ tự nhiên của Google .
Vì vậy, Project Euler cung cấp một dịch vụ tuyệt vời với các vấn đề cụ thể, nhưng trong trường hợp học máy, bạn có thể sử dụng các bộ dữ liệu hiện có với kiến trúc của sáng tạo của mình và so sánh "câu trả lời" với kết luận được trình bày trực tuyến hoặc trong các tài liệu nghiên cứu.