Tôi có các bài kiểm tra đơn vị nhỏ hơn sử dụng các đoạn nhỏ từ các tập dữ liệu thực. Tôi cũng muốn kiểm tra chương trình của mình dựa trên các bộ dữ liệu đầy đủ vì nhiều lý do. Vấn đề duy nhất là một bộ dữ liệu thực duy nhất có dung lượng khoảng ~ 5GB. Tôi chưa tìm thấy bất kỳ con số khó khăn nào cho những gì kho Git có thể lưu trữ nhưng dường như quá nhiều.
Giải pháp mà nhóm của tôi đã áp dụng là dự án có một tệp chứa đường dẫn đến hệ thống tệp đính kèm mạng chứa dữ liệu thử nghiệm của chúng tôi. Các tập tin được bỏ qua Git.
Tôi cảm thấy như đây là một giải pháp không hoàn hảo vì hai lý do. Khi NAS không hoạt động, chậm hoặc chậm hơn chúng ta không thể chạy thử nghiệm đầy đủ. Lý do thứ hai là khi ai đó lần đầu tiên nhân bản một kho lưu trữ, các bài kiểm tra đơn vị không thành công nên họ phải tìm ra cách gắn kết mọi thứ với một tên nhất định và cú pháp được sử dụng để xây dựng tệp đường dẫn thử nghiệm.
Vì vậy, câu hỏi của tôi là hai lần. Có bao nhiêu dữ liệu là quá nhiều dữ liệu để lưu trữ trong kiểm soát sửa đổi?
Một cách tốt hơn để xử lý một lượng lớn dữ liệu thử nghiệm là gì?