Bạn sẽ nhận được câu trả lời tốt hơn nhiều nếu bạn cung cấp thêm một vài chi tiết kỹ thuật về loại dữ liệu bạn đang cố gắng đặt dưới sự kiểm soát phiên bản, cách bạn muốn lưu trữ các phiên bản dữ liệu khác nhau, thành phần nào có thể thay đổi và những thành phần nào không, và liệu bạn có thực sự có lịch sử giống như cây (các nhánh, hợp nhất) hay không.
Các tệp HDF5 không phù hợp để kiểm soát phiên bản dựa trên diff theo git.
git sử dụng cơ sở dữ liệu dựa trên hàm băm dưới mui xe, vì vậy có thể lưu trữ hàm băm của tệp dữ liệu HDF5 của bạn mà không thực sự lưu trữ tệp. Ba dự án, git-fat , git-annex và git-media , đơn giản hóa rất nhiều quá trình này cho bạn. Tôi sẽ đề nghị sử dụng phương pháp này nếu bạn có khối dữ liệu lớn, hoàn toàn độc lập mà bạn muốn phiên bản rõ ràng.
Nếu bạn có thể tách lưu trữ dữ liệu của mình thành các vùng không biến động và dễ bay hơi, điều này sẽ cải thiện đáng kể hiệu quả tương tác của bạn với cơ sở dữ liệu kiểm soát phiên bản. Bạn cũng có thể muốn xem xét rõ ràng bằng cách sử dụng cơ sở dữ liệu cho dữ liệu của mình nếu bạn không cần các tính năng DVCS mà git cung cấp.