Chúng tôi đã sử dụng một hệ thống tệp được sắp xếp theo thứ bậc theo: - phạm vi địa lý (quốc gia hoặc lục địa) - nhà cung cấp dữ liệu, người cấp phép - tên miền / tập dữ liệu - ngày / phiên bản
Sau đó, chúng tôi có chính sách tách dữ liệu nguồn (ở cùng định dạng trên bất kỳ CD / DVD nào chúng tôi nhận được từ nhà cung cấp) khỏi mọi bộ dữ liệu có nguồn gốc mà chúng tôi sản xuất trong công ty.
Hệ thống tệp giúp dễ dàng lấy bất kỳ dữ liệu nào từ khách hàng và cũng cho phép linh hoạt về lưu trữ vật lý - chúng tôi lưu trữ trên các đĩa lớn hơn, chậm hơn và chúng tôi có các máy chủ tệp đặc biệt (được liên kết trong hệ thống phân cấp) các bộ dữ liệu được sử dụng thường xuyên hơn.
Để tạo điều kiện quản lý trong các dự án, chúng tôi sử dụng các liên kết tượng trưng. Chúng tôi giữ các vectơ của mình trong cơ sở dữ liệu (Oracle) và chúng tôi đặt quy tắc để có ít nhất một phiên bản cơ sở dữ liệu cho mỗi khách hàng (và một số người dùng / lược đồ cho các dự án). Tuy nhiên, chúng tôi đã không lưu giữ nhiều trình quét trong cơ sở dữ liệu vì chúng có xu hướng chiếm quá nhiều không gian ngay cả bên ngoài. Ngoài ra, chúng tôi muốn giữ cho các trường hợp cơ sở dữ liệu của chúng tôi càng nhẹ càng tốt.
Và vâng, chúng tôi có một người chịu trách nhiệm "kiểm soát" toàn bộ mọi thứ để nó không trở nên quá lộn xộn.
Vấn đề lớn nhất mà chúng tôi gặp phải với thiết lập này hiện tại là thiếu giao diện người dùng đẹp sẽ giúp chúng tôi có cái nhìn tổng quan hơn về toàn bộ vấn đề và chúng tôi đã lên kế hoạch bao gồm một bộ lưu trữ siêu dữ liệu lên trên tất cả. Chúng tôi vẫn đang xem xét các lựa chọn của chúng tôi ở đây.
Chúng tôi đang sử dụng kiểm soát phiên bản cho mã của chúng tôi và chúng tôi đã sử dụng nó cho các tài liệu, nhưng hóa ra việc kiểm soát phiên bản không thực sự được tạo cho các bộ dữ liệu lớn, đặc biệt nếu chúng chủ yếu là các tệp nhị phân, vì vậy tôi không khuyến nghị rằng , ngoại trừ nếu bạn đang xử lý GML hoặc một cái gì đó tương tự như văn bản (các vấn đề bao gồm chi phí rất lớn đối với việc sử dụng đĩa phía máy chủ cũng như các máy khách gặp sự cố khi kiểm tra kho lưu trữ lớn).