Đến khá muộn với việc này, tôi nghĩ điều này có thể hữu ích nếu bạn cần siêu dữ liệu để duy trì I / O. Có một gói tương đối mới có tên h5io mà tôi đang sử dụng để thực hiện điều này.
Nó sẽ cho phép bạn đọc / ghi nhanh từ HDF5 đối với một số định dạng phổ biến, một trong số chúng là khung dữ liệu. Vì vậy, bạn có thể, chẳng hạn, đặt khung dữ liệu vào từ điển và bao gồm siêu dữ liệu dưới dạng các trường trong từ điển. Ví dụ:
save_dict = dict(data=my_df, name='chris', record_date='1/1/2016')
h5io.write_hdf5('path/to/file.hdf5', save_dict)
in_data = h5io.read_hdf5('path/to/file.hdf5')
df = in_data['data']
name = in_data['name']
etc...
Một lựa chọn khác sẽ là xem xét một dự án như xray , theo một số cách thì phức tạp hơn, nhưng tôi nghĩ nó cho phép bạn sử dụng siêu dữ liệu và khá dễ dàng để chuyển đổi thành DataFrame.