Làm thế nào để lưới dữ liệu phân loại lấy mẫu không đồng đều?


10

Tôi đang tìm kiếm một phương pháp để chia lưới dữ liệu phân loại. Tôi đã trích xuất từ ​​các biểu đồ hải lý và các trang hiện trường một tập hợp các điểm chỉ định bản chất của bề mặt đáy đại dương. Những dữ liệu này được phân loại chứ không phải bằng số và chúng không được lấy mẫu thường xuyên và thậm chí không được lấy mẫu ngẫu nhiên. Biểu đồ hải lý được tạo ra để hỗ trợ điều hướng và neo đậu; chúng không được tạo ra để lập bản đồ môi trường sống. Như vậy, nhiều âm thanh được tạo ra gần bờ nơi độ sâu tương đối nông có thể gây nguy hiểm cho giao thông thủy và nơi tàu có xu hướng neo đậu. Hơn nữa từ bờ, nơi độ sâu không đủ để điều hướng và neo là không thực tế, âm thanh được thực hiện ít thường xuyên hơn.

Có ai khác đã cố gắng tạo ra các bản đồ nền có lưới từ các biểu đồ hải lý?

Tôi đã nhìn vào đa giác Thiessen (Vornoi) nhưng sự tập trung của các âm thanh dọc theo bờ biển dẫn đến một "tổ ong" tốt dọc theo bờ biển, các đa giác lớn ngoài khơi và ở giữa các đa giác hình chiếc bánh dài kéo dài ra ngoài khơi. Tạo lưới bằng cách sử dụng hàng xóm gần nhất mang lại kết quả tương tự.

Tôi cần một cách để hạn chế ảnh hưởng của các điểm nông, gần bờ - một cách để hạn chế các đa giác hình bánh dài đó. Ở vùng nước sâu hơn tôi không hy vọng rằng bản chất của đáy sẽ là sự tiếp nối của đáy gần bờ. Tôi bắt đầu suy nghĩ dọc theo hai dòng - cả hai đều sử dụng chiều sâu. Một là cân nhắc lựa chọn của người hàng xóm 'gần nhất' bằng cách sử dụng sự khác biệt về độ sâu giữa một ô lưới và các điểm lân cận. Một cách khác là bỏ chọn các điểm lân cận nhiều hơn một số dung sai quy định khác nhau về độ sâu. Hoặc, có lẽ thay vì dung sai được chỉ định trước, tôi có thể bin phạm vi độ sâu và sau đó giới hạn sự lựa chọn các điểm lân cận đối với các điểm trong cùng phạm vi độ sâu hoặc bin.

Bất kỳ suy nghĩ về cách thực hiện một trong hai lựa chọn này?

Kể từ khi nói chuyện với các đồng nghiệp trên các diễn đàn khác, tôi đã xem xét một vài cách tiếp cận khác. Việc đầu tiên liên quan đến việc sử dụng một rào chắn - đường viền sâu 100m - để hạn chế ảnh hưởng của dữ liệu gần bờ. Thách thức với cách tiếp cận này là bất kỳ thói quen nội suy ESRI nào có thể sử dụng các rào cản đều được thiết kế để hoạt động với dữ liệu liên tục thay vì dữ liệu không liên tục. Tôi có thể sử dụng các rào cản để phá vỡ các điểm thành nông gần bờ và các điểm sâu hơn trước khi tạo đa giác Thiessen. Tuy nhiên, tôi dự đoán các hiệu ứng cạnh tràn lan kể từ khi ArcGIS tạo ra các đa giác cho các khu vực hình chữ nhật không dành cho các khu vực phức tạp.

Cách tiếp cận thứ hai - được đề xuất bởi một số đồng nghiệp - là giết chết. Ban đầu tôi đã gạt bỏ việc ra tay vì tôi chỉ xem nó là dữ liệu liên tục. Thách thức với việc tìm kiếm là nó cũng không được thiết kế cho dữ liệu phân loại. Bây giờ, tôi đang xem xét việc đồng hóa với độ sâu và tính chất của bề mặt, nhưng, bất kỳ kiểu giết người nào cũng sẽ liên quan đến việc sử dụng mã số nguyên cho bản chất của bề mặt. Sau đó, các mã số dấu phẩy động kết quả sẽ phải được giảm về mã hóa số nguyên ban đầu. Không đẹp.

Có ai có thể đề nghị các dòng khác để làm theo không? (Người ta có thể sử dụng phân tích địa hình

Trân trọng,

Câu trả lời:


4

Cách tiếp cận giết người, được thực hiện một cách thích hợp, đầy hứa hẹn.

Để khởi hành, hãy xem "các mô hình địa lý tuyến tính tổng quát" được mô tả bởi Diggle & Ribeiro trong Mô hình địa lý dựa trên mô hình (Springer 2007). Ý tưởng cơ bản là hấp dẫn và linh hoạt: một quá trình ngẫu nhiên không gian ( liên tục theo không gian ) xác định các xác suất khác nhau của các danh mục. Người ta sử dụng các danh mục quan sát tại các điểm bất thường để suy ra các thuộc tính thống kê của quá trình cơ bản đó, bao gồm cả cấu trúc tương quan không gian của nó (variogram). Kriging sau đó tạo ra một bề mặt xác suất phù hợp với các quan sát. Tại thời điểm đó, bạn có thể thực hiện các mô phỏng địa lý hoặc bạn có thể tạo các bản đồ liên quan đến xác suất (như bản đồ của các danh mục xác suất tối đa, tôi tưởng tượng).

Điều này nghe có vẻ tinh vi, và nó là. Tuy nhiên, cuộc thảo luận của Diggle và Ribeiro khá dễ tiếp cận - mặc dù nó là toán học và có một số kiến ​​thức về thống kê, nhưng nó không phụ thuộc nhiều vào - và hầu hết các kỹ thuật của chúng được thực hiện trong các gói R mà chúng mô tả geoRgeoRGLM. Trên thực tế, thật công bằng khi hiểu cuốn sách này là hướng dẫn cho các gói này.

Như các chủ đề khác trên trang web này chứng thực, việc giao tiếp R với dữ liệu GIS tương đối dễ dàng (bao gồm cả định dạng shapefile và các định dạng raster khác nhau), vì vậy đó không phải là vấn đề.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.