Quy ước phân loại hoặc đặt tên tốt cho các tệp và thư mục chứa dữ liệu GIS là gì? [đóng cửa]


13

Công ty của tôi đã thu thập khoảng 30 TB dữ liệu GIS trong 8 năm qua và tôi luôn thấy mình hỏi những câu hỏi sau:

  1. Loại dữ liệu nào chúng ta có cho một khu vực địa lý nhất định?
  2. Các chi tiết về dữ liệu đó (ví dụ: độ phân giải tính bằng mét trên pixel) là gì?
  3. Trường hợp dữ liệu tồn tại trên ổ cứng để tôi thực sự có thể sử dụng nó?
  4. Chúng tôi đã xử lý dữ liệu chưa, hoặc nó ở dạng chưa được thay đổi từ nguồn?

Cho đến bây giờ, tôi đã cố gắng giải quyết những câu hỏi này bằng cách nghĩ ra một phân loại / phân loại tệp và thư mục thích hợp. Có ai có bất kỳ ý tưởng / đề xuất nào về một số cách dễ hiểu, thậm chí có thể là cách tổ chức dữ liệu GIS bằng các tệp và thư mục không?

Tôi cũng sẵn sàng tìm hiểu thêm về cách sử dụng cơ sở dữ liệu có thể mang lại lợi ích cho công ty của tôi; chúng tôi là nhà phát triển phần mềm, không phải chuyên gia về GIS, vì vậy tôi nghi ngờ chúng tôi hơi lạc hậu về cách tốt nhất để tiếp cận vấn đề lưu trữ / sắp xếp dữ liệu GIS để dễ sử dụng. Tôi đã thấy câu hỏi Thực tiễn tốt nhất để quản lý dữ liệu không gian địa lý nhưng chỉ có thể rút ra sử dụng cận biên trong số các câu trả lời vì tôi không quen với cơ sở dữ liệu địa lý.

CẬP NHẬT: Tuần trước tôi đã dành một chút thời gian để đọc về cơ sở dữ liệu GIS và bắt đầu làm quen với PostGIS. Về lâu dài, tôi nghĩ rằng chúng ta sẽ chuyển sang sử dụng cơ sở dữ liệu cộng với máy chủ siêu dữ liệu theo khuyến nghị của JasonBirch trong Thực tiễn tốt nhất để quản lý dữ liệu không gian địa lý .



Cảm ơn, câu hỏi đó chắc chắn có liên quan và cung cấp một số thông tin cơ bản tốt.
Sipp

Câu trả lời:


2

Nếu bạn thực sự đang cố gắng chỉnh sửa dữ liệu hoặc phát triển bản đồ, bạn sẽ cần giữ dữ liệu bạn đang tích cực làm việc tách biệt với dữ liệu bạn đã bắt đầu. Khi tôi bắt đầu một dự án, tôi tạo một thư mục SourceData, với các thư mục con được đặt tên theo loại dữ liệu (DEM, Orthophoto, Hydrology, v.v.) Điều này sẽ giữ tất cả các lớp mà tôi chỉ sử dụng để tham khảo. Mọi dữ liệu tôi đang làm việc sẽ được sao chép vào một thư mục khác có tên là Làm việc. Thư mục làm việc chứa dữ liệu, MXD và bất cứ thứ gì khác mà tôi sửa đổi hoặc tạo trong các thư mục con thường tương quan với một giai đoạn của dự án (MXD, RoadEdits, Delivery, v.v.)

Ngoài dữ liệu GIS thực tế, bạn nên tạo thư mục Thông tin liên lạc hoặc Thông số kỹ thuật để giữ bất kỳ tài liệu nào từ khách hàng / khách hàng nội bộ / giáo sư của bạn. Điều này có thể phục vụ như siêu dữ liệu khi bạn quay lại dự án vào một ngày sau đó, cũng như tạo một vị trí tập trung nơi bất kỳ ai khác có thể thấy những gì sẽ xảy ra.


1
Điểm tốt; công ty chúng tôi tạo ra các bản đồ mà phần mềm của chúng tôi sử dụng và chúng tôi đã phát triển một sơ đồ thư mục để tách dữ liệu "thô" khỏi dữ liệu "làm việc" khỏi dữ liệu "đã hoàn tất". Một trong những vấn đề là theo dõi tập dữ liệu thô nào đã được sử dụng làm cơ sở ban đầu cho bản đồ cuối cùng; có vẻ như đề xuất của bạn cho một thư mục "Thông số kỹ thuật" sẽ giải quyết điều đó. Đối với mỗi bản đồ chúng tôi tạo, chúng tôi chắc chắn sẽ lưu ý nguồn dữ liệu thô nào đã được sử dụng trong quá trình tạo bản đồ (điều mà chúng tôi hiện không làm). Cảm ơn vì những lời khuyên!
Sipp

1

Dường như với tôi rằng bạn cần một bộ siêu dữ liệu để lưu trữ thông tin này và một hệ thống truy xuất sử dụng siêu dữ liệu để cho phép bạn trích xuất dữ liệu trên cơ sở thông tin.

Tôi nghĩ rằng bạn muốn một giải pháp hỗ trợ Dịch vụ Danh mục OGC, để có khả năng tương tác tối đa. Tôi đã thấy các đồng nghiệp sử dụng Deegree - mặc dù tất nhiên có những giải pháp khác bạn nên kiểm tra.

Đây là một ví dụ về cách chúng tôi gắn Deegree vào phần mềm của chúng tôi (bản demo trực tiếp đã ngừng bảo trì ngay bây giờ - bạn không biết! - nhưng sẽ được sao lưu vào tuần tới)

Đối với việc đặt tên tệp, nếu bạn có một dịch vụ danh mục và cơ chế phân phối, thì sẽ có ít vấn đề hơn về các tệp được đặt tên và vị trí của chúng. Mặt khác, tôi nghĩ rằng nó phụ thuộc vào cách bạn tìm kiếm dữ liệu. Trước tiên, bạn có bắt đầu bằng cách thu hẹp khu vực địa lý hoặc loại dữ liệu không? Điều đó sẽ xác định liệu hệ thống phân cấp bắt đầu bằng cách chia dữ liệu thành các ô, sau đó các loại dữ liệu trên mỗi ô; hoặc bằng cách chia nó thành các loại dữ liệu, mỗi loại có một tập hợp các ô.

Tất nhiên, với cơ sở dữ liệu không gian, bạn không gặp phải vấn đề tương tự về việc chia dữ liệu thành các ô, vì vậy đó thường là một phương pháp ưu tiên - cung cấp ứng dụng sử dụng cuối hỗ trợ sử dụng loại dữ liệu đó.


Cảm ơn những lời đề nghị Mark. Có vẻ như bạn đang đề xuất rằng có một vài thành phần đang hoạt động ở đây: chính siêu dữ liệu (ví dụ: tệp XML), hệ thống truy xuất (Deegree?) Biết cách tìm dữ liệu dựa trên các yêu cầu siêu dữ liệu nhất định từ người dùng và thành phần phụ trợ lưu trữ (ví dụ PostGIS?) lưu trữ cả dữ liệu và siêu dữ liệu. Điều đó có chính xác không?
Sipp

1

Tôi sẽ chọn SpatiaLitecơ sở dữ liệu một tệp nơi bạn có thể chèn tất cả các shapefiles, raster và bảng của mình. Sau đó, với tư cách là cơ sở dữ liệu SQL quan hệ, bạn có quyền truy vấn SQL để thực hiện tất cả các hành động cần thiết (tham gia, chọn, hợp nhất, kết hợp, phân tách, v.v.) giữa các thuộc tính và tệp.

SpatiaLite cũng có thể truy cập từ các ngôn ngữ lập trình như Python để có mức độ tự động hóa cao hơn. Bầu trời là giới hạn.

SpatiaLite Tài liệu và hướng dẫn


0

Tôi thấy hữu ích khi tạo tài liệu Word có tiêu đề "Tên bản đồ hoặc chủ đề - Siêu dữ liệu bình luận.doc". Tài liệu chỉnh sửa chính và quy trình công việc theo thứ tự thời gian (YYYY-MM-DD) cho mỗi bản đồ và / hoặc chủ đề tập dữ liệu. Nếu bạn cần tìm ra lịch sử của tập dữ liệu: i) Bao gồm ngày sửa đổi / ngày được tạo của các tệp liên quan hữu ích như tài liệu tham khảo lịch sử hoặc tệp nguồn tiềm năng. Bao gồm một bản tóm tắt ngắn gọn về nội dung của từng tệp (tên lớp, số bản ghi) trong khi chú ý đến những điểm tương đồng hoặc khác biệt chung (nghĩa là có gì mới trong mỗi phiên bản của bản đồ hoặc tập dữ liệu). Giữ tệp "- Nhận xét siêu dữ liệu" trong cùng thư mục hoạt động với phiên bản mới nhất của bản đồ hoặc bộ dữ liệu. Đặt các phiên bản cũ hơn của bản đồ hoặc dữ liệu trong thư mục con Lưu trữ. Quy trình ba bước hoạt động tốt để phát triển phần mềm, phát triển cơ sở dữ liệu và quản lý tệp: 1) Phát triển (& tài liệu); 2) Kiểm tra (& tài liệu); 3) Xuất bản (bao gồm siêu dữ liệu). 1) Thư mục làm việc; 2) Lưu trữ thư mục con; 3) Phiên bản đã xuất bản.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.