Những cách mới lạ để điền vào các giá trị còn thiếu trong raster


8

Tôi đang tìm kiếm những cách mạnh mẽ để điền vào các giá trị còn thiếu trong một số trình quét. Tất cả đều có một lớp duy nhất. Các giá trị bị thiếu bao gồm các pixel đơn đến các miếng vá có kích thước trung bình. Các trình quét có kích thước khoảng 1000 x 1000 pixel và các bản vá lớn nhất giống như 20x20 pixel.

Tôi muốn sử dụng aregImpute trong gói H'misc. Có ai đã sử dụng nó cho mục đích này?

Cách tiếp cận này có vẻ rất tuyệt nhưng tôi nghĩ nó chỉ mang ý nghĩa thẩm mỹ.

Giải thích chi tiết về điều này:

Tất cả các raster (tôi có tổng cộng 36) chia sẻ cùng một mức độ, chúng trùng nhau và được căn chỉnh. Mỗi raster là một biến khác nhau, tôi thu thập biến từ nhiều nguồn khác nhau (viễn thám, địa hình và khí hậu). Các raster ban đầu đến trong các nghị quyết khác nhau. Nhỏ nhất là 30m. Từ đó trở lên họ cao tới 1km. Tôi đã ghép lại tất cả mọi thứ bằng cách sử dụng tích chập khối (tất cả các biến là continuos) đến 1km. Tôi có một raster 1km khác, nơi tôi có dữ liệu của một biến quan tâm cho một số điểm được lấy mẫu. Vì vậy, tôi đã đào tạo một mô hình bằng cách sử dụng các điểm đó và các raster khác như là các biến số để có thể tạo ra một raster đầy đủ của biến đó. Thật không may, hầu hết các raster đồng biến có một số giá trị bị thiếu trong đó, thực sự không nhiều nhưng tôi muốn loại bỏ hoàn toàn vấn đề.

Cảm ơn bạn.

ps Tôi thích sử dụng R cho việc này.


Lý do của sự thiếu sót là gì và tại sao bạn điền vào các giá trị? (Cả hai điều này đều quan trọng trong việc lựa chọn một giải pháp phù hợp.) Chính xác thì ý của bạn là "mạnh mẽ" là gì? (Nó có ý nghĩa thống kê kỹ thuật nhưng chưa rõ cách áp dụng ở đây.)
whuber

Tôi đang sử dụng các lớp như là đồng biến cho một mô hình dự đoán. Mô hình tôi đang sử dụng không xử lý các giá trị bị thiếu, do đó, đơn giản là nó không tính toán các pixel có giá trị bị thiếu trong bất kỳ trình quét nào, để lại các lỗ hổng trong "lớp dự đoán" của tôi. Có lẽ từ mạnh mẽ được sử dụng kém, tôi xin lỗi. Những gì tôi sẽ tìm kiếm là việc cắt bỏ bảo tồn mối quan hệ cơ bản giữa hiệp phương sai và biến mục tiêu của tôi. Tôi không chắc làm thế nào để gọi điều này, giả định đa dạng?
JEquihua

Tùy thuộc vào biến số, sai số được gây ra bởi lỗi cảm biến hoặc lỗi đo lường được thay thế bằng một giá trị bị thiếu.
JEquihua

Làm raster của bạn chồng chéo hay không? Nếu chúng không trùng nhau, hoặc nếu số lượng trùng lặp thông thường chỉ là hai hoặc ba raster tại bất kỳ điểm nào, thì sẽ rất khó để có được nhiều giá trị từ đó aregImpute. Mặt khác, đó là một cách tiếp cận đầy hứa hẹn sẽ còn hấp dẫn hơn nữa nếu bạn đưa các thuật ngữ tương quan không gian vào mô hình.
whuber

1
Dữ liệu bị thiếu do các vấn đề cảm biến luôn có mối tương quan không gian. Tôi nghi ngờ rằng bất kỳ phương pháp hợp lý nào giải thích cho mối tương quan này, dù đơn giản đến mức nào, sẽ thực hiện tốt hơn cả những phương pháp tinh vi nhất mà bỏ qua mối tương quan đó. Việc lấy lại mẫu có thể là một vấn đề, nhưng không rõ bạn đã làm gì. Một lời giải thích chi tiết hơn trong câu hỏi của bạn sẽ được hoan nghênh. (Một nguyên tắc chung tốt là để thực hiện các phân tích thống kê của bạn với dữ liệu gốc chứ không phải là dữ liệu resampled nếu bạn có thể, để tránh hiện vật của resampling.)
whuber

Câu trả lời:


5

Tôi là tác giả của gói R gapfill, là một công cụ linh hoạt để dự đoán các giá trị bị thiếu trong các bộ dữ liệu viễn thám theo thời gian. https://CRAN.R-project.org/package=gapfill Nó có thể hữu ích trong trường hợp của bạn.

Để biết tổng quan về các phương pháp được công bố để dự đoán các giá trị còn thiếu trong các bộ dữ liệu viễn thám, hãy xem Bảng 1 của ấn phẩm tương ứng https://doi.org/10.1109/TGRS.2017.2785240 .


1
Gói thú vị. Công việc tốt đẹp!
aldo_tapia
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.