Tôi hiện đang cố gắng tự mình thực hiện một số thuật toán Machine Learning. Nhiều người trong số họ có đặc tính khó chịu là khó gỡ lỗi, một số lỗi không khiến chương trình bị sập, nhưng hoạt động không như dự định và dường như các thuật toán chỉ cho kết quả yếu hơn.
Tôi muốn có một số cách để tăng sự tự tin của tôi trong việc triển khai, ví dụ nếu tôi có một số bộ dữ liệu nhỏ, với thông tin bổ sung "Thuật toán X hoạt động cho các lần lặp Y và có kết quả Z trên tập dữ liệu này", điều đó thực sự hữu ích. Có ai nghe nói về các bộ dữ liệu như vậy?