Khi làm việc với các raster có độ phân giải khác nhau, người ta nên lấy mẫu lại thành độ phân giải cao nhất hoặc thấp nhất?


16

Tôi đang tìm kiếm các khuyến nghị về các thực tiễn tốt nhất để xử lý các lớp dữ liệu raster với các độ phân giải và dự đoán khác nhau. Lời khuyên tôi đã đưa ra là luôn lấy mẫu lại cho lớp có độ phân giải thấp nhất trước khi thực hiện bất kỳ phân tích nào, nhưng điều này có vẻ như rất lãng phí độ chính xác đối với tôi và tôi chưa bao giờ được đưa ra một lời giải thích chắc chắn về lý do tại sao nó nên được thực hiện.

Khi nào thì hợp lý để lấy mẫu lại để phù hợp với lưới độ phân giải cao hơn và những tác động so với việc lấy lại mẫu cho độ phân giải thấp hơn là gì?

Tôi nhận ra rằng điều này rất có thể phụ thuộc vào tình huống. Tôi chủ yếu tìm kiếm các hướng dẫn chung, nhưng đây là kịch bản cụ thể của tôi để tham khảo:

Kịch bản: Tôi đang tìm cách xây dựng mô hình hồi quy không gian dự đoán sử dụng đất dựa trên nhiều tầng lớp kinh tế và xã hội. Bản đồ sử dụng đất của tôi là Landsat có nguồn gốc và do đó độ phân giải 30m. Ví dụ về các lớp giải thích bao gồm SRTM DEM (3 cung-giây, ~ 90m) và các lớp khí hậu Bioclim (30 cung-giây, ~ 1km).


1
Bạn có thể vui lòng cung cấp thêm thông tin về mô hình hồi quy và phương pháp thực hiện không? +1 cho một câu hỏi thú vị, được xây dựng tốt!
Aaron

Tôi đang so sánh độ che phủ rừng tại hai thời điểm và sử dụng mô hình hồi quy logistic với xác suất phá rừng (nhị phân) là phản ứng của tôi. Tôi sẽ triển khai nó trong R.
Matt SM

Câu trả lời:


17

Trên thực tế, đó không phải là tất cả tình huống phụ thuộc và tất cả là về lỗi thống kê.

Bất cứ khi nào bạn lấy mẫu lại với độ phân giải cao hơn, bạn đang đưa ra độ chính xác sai. Chỉ xem xét một tập hợp dữ liệu được đo bằng feet ở cả số. Bất kỳ điểm đã cho nào cũng có thể cách vị trí thực tế của nó khoảng +/- 0,5 feet. Nếu bạn lấy mẫu lại đến phần mười gần nhất, bạn hiện đang nói bất kỳ số đã cho nào không quá +/- 0.1 từ vị trí thực tế của nó. Tuy nhiên, bạn biết rằng các phép đo ban đầu của bạn không chính xác và hiện bạn đang hoạt động trong phạm vi lỗi. Tuy nhiên, nếu bạn đi theo cách khác và lấy mẫu lại ở độ phân giải thấp hơn, bạn biết rằng mọi giá trị điểm đã cho đều chắc chắn chính xác vì nó được chứa trong phạm vi sai số của mẫu lớn hơn.

Ngoài toán học thống kê, nơi đầu tiên mà tôi nghĩ đến là trong khảo sát đất đai. Các khảo sát cũ hơn chỉ xác định vòng bi xuống đến nửa phút gần nhất và khoảng cách đến một phần mười của bàn chân. Vẽ sơ đồ đường biên với các phép đo này thường có thể dẫn đến sai lệch (điểm bắt đầu và điểm kết thúc phải giống nhau nhưng không được đo) tính bằng feet. Các cuộc khảo sát hiện đại đi đến ít nhất là giây thứ hai và gần nhất của một bàn chân. Các giá trị phái sinh (như diện tích của rất nhiều) có thể bị ảnh hưởng đáng kể bởi sự khác biệt về độ chính xác. Giá trị dẫn xuất cũng có thể được đưa ra là quá chính xác.

Trong trường hợp phân tích của bạn, nếu bạn lấy mẫu lại với độ phân giải cao hơn, kết quả của bạn sẽ có nghĩa là độ chính xác cao hơn nhiều so với dữ liệu mà chúng dựa trên. Hãy xem xét SRTM của bạn ở 90m. Bằng bất kỳ phương pháp nào họ đo được độ cao (avg / max / mean return), đơn vị (pixel) nhỏ nhất có thể phân biệt với các lân cận của nó là 90m. Nếu bạn lấy mẫu lại thành 30m, một trong hai:

  • bạn giả sử tất cả chín pixel kết quả đều có cùng độ cao khi trong thực tế có thể chỉ có một - trung tâm hoặc trên cùng bên trái - (hoặc không có gì!) là
  • bạn nội suy giữa các pixel, tạo các giá trị dẫn xuất không có trước

Do đó, trong cả hai trường hợp, bạn đưa ra độ chính xác sai vì các mẫu con mới của bạn không thực sự được đo.

Câu hỏi liên quan: Những thực hành nào có sẵn để mô hình hóa sự phù hợp đất đai?


Điều đó chắc chắn giữ cho dữ liệu điểm. Nhưng tôi tự hỏi liệu nó có khác nhau đối với dữ liệu raster tính trung bình một lượng không gian thay đổi liên tục trong đó có độ chính xác về vị trí và độ chính xác của đại lượng đo. Ngoài ra, số lượng khác nhau có mức độ khác nhau về không gian. Ví dụ, việc lấy lại dữ liệu độ cao đến độ phân giải cao hơn phải gây ra nhiều lỗi ở khu vực miền núi hơn là thảo nguyên.
Matt SM

@MattSM Điều đó đúng với tất cả các dữ liệu không gian và được kết hợp bởi lỗi thống kê của đại lượng đo. Hãy xem xét SRTM của bạn ở 90m. Bằng bất kỳ phương pháp nào họ đo được độ cao (avg / max / mean return), đơn vị (pixel) nhỏ nhất có thể phân biệt với các lân cận của nó là 90m. Nếu bạn lấy mẫu lại thành 30m, thì bây giờ bạn đang nói tất cả 9 pixel kết quả có cùng độ cao khi trong thực tế có thể chỉ có một (hoặc không có!) Là - ở giữa hoặc trên cùng bên trái. Hoặc bạn nội suy giữa các pixel, tạo các giá trị không có trước đó, do đó độ chính xác sai. Và có, phạm vi giá trị đóng đến lỗi tiềm năng.
Chris W

Cũng giống như một ghi chú bên cạnh, có thể nội suy các tính năng cụ thể trong các trường hợp đặc biệt trong đó mẫu bị giới hạn rõ ràng - một tính năng phi địa lý, xuất hiện trong tâm trí là tái tạo thông tin biển số từ các bức ảnh có độ phân giải quá thấp để đọc. Nhưng bạn phải biết những gì bạn đang nhìn vào Tôi nhớ lại một số trường hợp trong đó việc tái tạo biển số không thành công vì tấm bảng được đề cập là trong một kịch bản phi châu Âu như tiếng Ả Rập.
Steve Barnes

Thế còn các trình quét có độ phân giải dựa trên vòng cung, thì chúng không có các ô lưới có thể ở các khu vực / tỷ lệ khung hình khác nhau ở các khu vực khác nhau?
CMCDragonkai

@CMCDragonkai Tôi không chắc chắn làm thế nào để giải quyết vấn đề đó bởi vì bạn đang tham gia vào biểu diễn dữ liệu so với định dạng và phối hợp các hệ thống / dự đoán. Có, khu vực địa lý trong raster không nhất thiết phải đồng nhất như pixel vuông (hoặc tỷ lệ khung hình khác). Nhiều thông số dữ liệu sat sẽ cho bạn biết điều này (pixel là x tại nadir và y ở cạnh swath). Nhưng các vấn đề lấy mẫu lại vẫn được áp dụng - nếu bất cứ điều gì nó chỉ gây ra vấn đề. (Và xin lỗi vì sự chậm trễ, tôi đã không tham gia SE trong một thời gian.)
Chris W
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.