Lợi ích của tính năng Multipart?


27

Nhiều điểm, đường và đa giác được triển khai trong gần như mọi GIS, nhưng chúng mang lại lợi ích gì, nếu có, chúng có mang lại lợi ích gì không?

Trong một thuộc tính cơ sở dữ liệu quan hệ được chia sẻ bởi các tính năng khác nhau có thể được lưu trữ một lần và ID được sử dụng để liên kết chúng với các bản ghi hình học riêng biệt. Vì vậy, tính năng nhiều phần là một di sản lưu trữ dữ liệu tệp phẳng?

văn bản thay thế

Câu trả lời:


34

Nếu phần mềm của bạn không hỗ trợ các tính năng đa phần, bạn có thể phải sử dụng các độ dài bất thường và phức tạp để thực hiện các hoạt động không gian. Ví dụ, giao điểm của hai đa giác có thể, nói chung, có nhiều hơn một thành phần được kết nối. Thật thuận tiện, cả về mặt thuật toán và khái niệm, giả sử rằng một giao điểm như vậy trả về một đối tượng duy nhất (đa giác nhiều phần) chứ không phải là một số đa giác tùy ý. . loại bỏ rất nhiều xử lý hậu kỳ theo từng trường hợp phức tạp và có thể ngăn thông tin hữu ích biến mất.)

Từ quan điểm cơ sở dữ liệu quan hệ, các tính năng đa mục có thể chuẩn hóa: khi một thuộc tính không thể tách rời khỏi tập hợp đa giác, bạn muốn biểu diễn bộ sưu tập đó dưới dạng một đối tượng. Một ví dụ điển hình sẽ là một tính năng đại diện cho hầu hết các quốc gia trên thế giới có đường bờ biển, bởi vì quốc gia này có thể bao gồm một số đảo. Bạn có thực sự muốn buộc RDBMS của mình tạo một bản sao các thuộc tính của quốc gia cho mỗi hòn đảo nhỏ không? Hầu như không. Bạn thậm chí không muốn (hoặc cần) duy trì nhiều bản sao của một con trỏ tới các thuộc tính.

Làm thế nào bạn sẽ đại diện cho một mạng hoặc một nhánh cây nếu không phải là một đa tuyến phối hợp?

Từ quan điểm của toán học hoặc cấu trúc dữ liệu thuật toán, cho phép một tính năng nhiều phần là một sự đơn giản hóa, không phải là một sự phức tạp. Để hỗ trợ đa giác được kết nối nhiều lần (vòng và đa giác có "lỗ"), bạn đã cần bộ máy để thể hiện đa giác nhiều phần.

Cuối cùng, các đối tượng "vectơ" và "biểu diễn spaghetti" điển hình của chúng có nguồn gốc từ lý thuyết về các phức hợp đơn giản . (Chỉ thông qua mối liên hệ có phần khó hiểu này với lý thuyết cấu trúc liên kết mà thuật ngữ "cấu trúc liên kết" đã biến nó thành GIS, về mặt khác không sử dụng gì từ lý thuyết đó.) Lý thuyết đó đòi hỏi và lợi ích từ các tính năng đa phần. Trong thực tế, chỉ có một thành phần duy nhất không phải là một phần của định nghĩa phức tạp đơn giản, mà hóa ra là một tài sản đặc biệt được một số người trong số họ yêu thích (được phát hiện bởi thứ hạng của nhóm tương đồng zeroth của họ). Như vậy, "một phần" không phải là một thuộc tính xác định, mà chỉ là một chất lượng tôpô theo nghĩa tương tự rằng có một vòng hoặc "lỗ" trong đa giác là một chất lượng tôpô (liên quan đến thứ hạng của nhóm tương đồng đầu tiên) .


1
Câu trả lời rất hay. Tôi không bị thuyết phục 100% về việc sử dụng các tính năng đa mục tiêu để bình thường hóa cơ sở dữ liệu - mỗi đa giác vẫn có các thuộc tính duy nhất như diện tích và chiều dài và một truy vấn như "bao nhiêu khu vực của Hy Lạp được tạo thành từ các đảo" trở nên khó trả lời mà không có đưa ra từng thuộc tính đa giác.
geographika

2
@geographika Yours là một ví dụ tốt về lý do tại sao một người cần linh hoạt trong việc đại diện cho các thực thể (không gian hoặc không) với cơ sở dữ liệu. Để kéo dài hơn nữa, người ta cũng có thể lập luận rằng các đa giác riêng lẻ cần được "nổ" vào các vòng bên ngoài và bên trong của chúng để trả lời các câu hỏi như "bao nhiêu khu vực của Hy Lạp được tạo thành từ các hồ?" Bất kỳ cấu trúc cơ sở dữ liệu nhất định sẽ làm cho các truy vấn nhất định dễ dàng và các truy vấn khác khó hơn; do đó, một phần của thiết kế cơ sở dữ liệu tốt phải bao gồm việc xem xét mục đích sử dụng của cơ sở dữ liệu. Một DBMS tốt (không gian) sẽ cung cấp các cơ chế để chuyển đổi giữa các cấu trúc khác nhau.
whuber

2
+1 Câu trả lời tuyệt vời. Có thể đáng để thảo luận về nhược điểm hiệu suất đối với các tính năng nhiều phần. Đi theo đường đa tuyến của đường cao tốc Hoa Kỳ nơi các tính năng đường cao tốc được phân chia tại các ranh giới tiểu bang. Tạo một featureclass thứ hai bằng cách hòa tan trên tên đường cao tốc, kết quả là I-10 trải dài khắp lục địa. Bây giờ so sánh hiệu suất của công cụ Xác định. Trừ khi chiến lược lập chỉ mục không gian của ESRI đã thay đổi, nó sẽ chậm hơn trên hệ thống nhiều lớp vì có nhiều MBR chồng chéo lẫn nhau. Mỗi tọa độ của từng tính năng có MBR trùng với điểm được kiểm tra.
Kirk Kuykendall

@Kirk Điểm tốt. Các ví dụ của bạn chỉ ra sự thiếu sót trong công nghệ của ESRI hơn là chúng làm nổi bật các vấn đề về nguyên tắc. Xác định một tính năng bằng cấu trúc dữ liệu không gian đơn giản nhưng hiệu quả hợp lý, chẳng hạn như một phần tư, nên có hiệu suất O (log (N)) (sau bộ đệm ban đầu của cấu trúc dữ liệu được lưu trữ). Việc tách từng tính năng N (được cho là lớn) thành trung bình của các mảnh K (được cho là vừa hoặc nhỏ so với N) làm tăng log (N) để ghi nhật ký (N) + log (K), trong đó - được đưa ra giả định - thực tế không chú ý
whuber

1
@Dandy Cảm ơn bạn đã làm nổi bật sự khác biệt giữa hình học đa phần và bộ sưu tập các mảnh đơn thuần. Tôi không nghĩ rằng tất cả các loại tính năng đa phần nhất thiết phải "ràng buộc" các thành phần của chúng; điều này có khả năng phụ thuộc vào việc thực hiện - chỉ ra rằng khái niệm "đa phần" có chứa một số biến thể tinh tế.
whuber

12

Hãy tưởng tượng việc nối dữ liệu dân số vào một bảng đa giác một phần đại diện cho các quốc gia. Tùy thuộc vào cách bạn tham gia, mỗi đảo sẽ có được toàn bộ dân số của quốc gia đó hoặc chỉ một đa giác của tập hợp sẽ có được toàn bộ dân số. Không đại diện cho quốc gia dưới dạng đa giác đa phần, bạn phải phân bổ dân số (không cần phức tạp và không chính xác) hoặc thu thập các đa giác lại với nhau trước khi tham gia trong trường hợp đó về cơ bản bạn lại kết thúc với đa giác nhiều phần.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.