Tại sao bạn phải cung cấp một mô hình variogram khi bạn đang giết người?


9

Tôi rất mới với số liệu thống kê không gian và xem rất nhiều hướng dẫn,

Nhưng tôi không thực sự hiểu lý do tại sao bạn phải cung cấp một mô hình variogram khi bạn krige.

Tôi đang sử dụng gói gstat trong R và đây là ví dụ họ đưa ra:

library(sp)
data(meuse)
coordinates(meuse) = ~x+y
data(meuse.grid)
str(meuse.grid)
gridded(meuse.grid) = ~x+y
m <- vgm(.59, "Sph", 874, .04)
print(m)
# ordinary kriging:
x <- krige(log(zinc)~1, meuse, meuse.grid, model = m)

Có ai có thể giải thích trong một vài dòng tại sao trước tiên bạn phải cung cấp vgm? Và làm thế nào để bạn thiết lập các tham số?

Cảm ơn bạn trước! Kasper


Đối với việc đơn giản hóa công cụ ước tính là BLUE chỉ khi hiệp phương sai trung bình và không gian được biết trước. Trong thông thường, người ta ước tính variogram từ dữ liệu và sau đó thực hiện phép nội suy. Xem họa tiết từ gstatgói R của cùng một dữ liệu meuse.
Andy W

Này Andy, cảm ơn vì nhận xét của bạn. Tôi phát hiện ra trong các họa tiết rằng bạn cũng có thể krige mà không cần một mô hình variogram. Tôi đã làm như sau: krige (phần dư ~ 1, temp_plot_spatial, y, nmin = 5, nmax = 10), vì vậy krige chỉ nhìn vào tối thiểu 5 hàng xóm và tối đa 10. Điều này có ý nghĩa gì không? Kết quả thật tuyệt: dropbox.com/s/7lxvfiyfl7ekhb4/ Khăn
Kasper

Tôi nghĩ rằng tôi có một vấn đề với việc mô hình hóa variogram: nếu bạn cho rằng mối tương quan không liên quan gì đến khoảng cách nhưng với hàng xóm gần nhất thì sao?
Kasper

"nếu bạn cho rằng mối tương quan không liên quan gì đến khoảng cách nhưng với những người hàng xóm gần nhất thì sao?" - đó không phải là giết chết, nó là nội tuyến hơn với phân loại knn. Các mã krige(residuals~1 ,temp_plot_spatial, y, nmin=5, nmax=10)ước tính variograms địa phương. Ví dụ: bạn không có một bản ghi âm trên toàn bộ không gian nghiên cứu, nhưng hãy ước tính một mô hình mới cho mọi vị trí bạn đang cố gắng dự đoán. Mô hình cục bộ sau đó chỉ lấy 10 giá trị gần nhất (vì bạn không chỉ định khoảng cách tối đa nên nó luôn lấy 10 giá trị, do đó nminsẽ không cần thiết).
Andy W

1
Sau đó, ước tính variograms địa phương là một điều hợp lý để làm. Nếu chúng thay đổi theo các tính năng nhất định bao gồm các dự đoán khác trong mô hình là một tùy chọn là tốt. IDW có thể được coi là loại mô hình giết người đơn giản nhất - vì vậy IDW sẽ không tốt hơn so với việc ước tính thực sự các biến thể từ dữ liệu.
Andy W

Câu trả lời:


9

Giới thiệu và Tóm tắt

Luật địa lý của Tobler khẳng định

Mọi thứ đều liên quan đến mọi thứ khác, nhưng những thứ ở gần có liên quan nhiều hơn những thứ ở xa.

Kriging áp dụng một mô hình của những mối quan hệ trong đó

  • "Mọi thứ" là các giá trị số tại các vị trí trên bề mặt trái đất (hoặc trong không gian), thường được biểu diễn dưới dạng mặt phẳng Euclide.

  • Các giá trị số này được coi là hiện thực hóa các biến ngẫu nhiên.

  • "Liên quan" được thể hiện dưới dạng phương tiện và hiệp phương sai của các biến ngẫu nhiên này.

(Một tập hợp các biến ngẫu nhiên liên quan đến các điểm trong không gian được gọi là "quá trình ngẫu nhiên".) Phép đo cung cấp thông tin cần thiết để tính toán các hiệp phương sai đó.

Kriging là gì

Kriging đặc biệt là dự đoán của những thứ ở những nơi mà chúng không được quan sát. Để làm cho quá trình dự đoán có thể dễ dàng toán học, Kriging giới hạn các công thức có thể là các hàm tuyến tính của các giá trị quan sát được. Điều đó làm cho vấn đề trở thành một trong những quyết định hữu hạn của các hệ số. Chúng có thể được tìm thấy bằng cách yêu cầu quy trình dự đoán có các thuộc tính nhất định. Theo trực giác, một đặc tính tuyệt vời là sự khác biệt giữa giá trị dự đoán và giá trị thực (nhưng chưa biết) nên có xu hướng nhỏ: đó là, công cụ dự đoán phải chính xác . Một thuộc tính khác được chào mời nhiều nhưng đáng nghi ngờ hơn là trung bình người dự đoán nên bằng giá trị thực: nó phải chính xác .

(Lý do khăng khăng về độ chính xác hoàn hảo là đáng nghi ngờ - nhưng không hẳn là xấu - là vì nó thường làm cho bất kỳ quy trình thống kê nào kém chính xác hơn: đó là, nhiều biến đổi hơn. Khi bắn vào mục tiêu, bạn muốn phân tán các cú đánh đều xung quanh vành và hiếm khi đánh vào trung tâm hoặc bạn sẽ chấp nhận kết quả được tập trung ngay bên cạnh, nhưng không chính xác, trung tâm? Cái trước là chính xác nhưng không chính xác trong khi cái sau không chính xác nhưng chính xác.)

Các giả định và tiêu chí này - có nghĩa là và hiệp phương sai là những cách thích hợp để định lượng sự liên quan, dự đoán tuyến tính sẽ hoạt động và dự đoán phải chính xác đến mức có thể chính xác hoàn toàn - dẫn đến một hệ phương trình có giải pháp duy nhất cung cấp hiệp phương sai đã được chỉ định một cách nhất quán . Do đó, công cụ dự đoán kết quả được gọi là "BLUP": Dự đoán không thiên vị tuyến tính tốt nhất.

Trường hợp biến thể đi vào

Tìm các phương trình này đòi hỏi phải vận hành chương trình vừa mô tả. Điều này được thực hiện bằng cách viết ra các hiệp phương sai giữa yếu tố dự đoán và các quan sát được coi là các biến ngẫu nhiên. Các đại số của hiệp phương sai khiến hiệp phương sai giữa các giá trị quan sát để tham gia vào các phương trình Kriging, quá.

Tại thời điểm này, chúng ta đi đến ngõ cụt, bởi vì những hiệp phương sai này hầu như không được biết đến. Xét cho cùng , trong hầu hết các ứng dụng, chúng tôi chỉ quan sát thấy một nhận thức của từng biến ngẫu nhiên: cụ thể là tập dữ liệu của chúng tôi, chỉ tạo thành một số tại mỗi vị trí riêng biệt. Nhập variogram: hàm toán học này cho chúng ta biết hiệp phương sai giữa hai giá trị nên là gì. Điều bị ràng buộc là đảm bảo rằng các hiệp phương sai này là "nhất quán" (theo nghĩa là nó sẽ không bao giờ đưa ra một tập hợp các hiệp phương sai về mặt toán học: không phải tất cả các tập hợp các số đo "liên quan" sẽ tạo thành ma trận hiệp phương sai thực tế ). Đó là lý do tại sao một variogram là cần thiết cho Kriging.

Người giới thiệu

Bởi vì câu hỏi ngay lập tức đã được trả lời, tôi sẽ dừng ở đây. Độc giả quan tâm có thể tìm hiểu cách đánh giá và giải thích các cách viết bằng cách tham khảo các văn bản tốt như Công cụ địa lý khai thác của Journel & Huijbregts (1978) hoặc Địa lý ứng dụng của Isaaks & Srivastava (1989). (Lưu ý rằng giới thiệu quy trình lập dự toán hai đối tượng được gọi là "variogram": một thực nghiệm variogram có nguồn gốc từ dữ liệu và một mô hình variogram được trang bị cho nó tất cả các tham chiếu tới "variogram" trong câu trả lời này là để mô hình Cuộc gọi đến.. vgmTrong câu hỏi trả về một đại diện máy tính của một variogram mô hình.) Đối với một cách tiếp cận hiện đại hơn trong đó ước lượng variogram và Kriging được kết hợp một cách thích hợp, xem Diggle &Mô hình địa lý dựa trên mô hình (2007) (cũng là hướng dẫn mở rộng cho các Rgói GeoRGeoRglm).


Bình luận

Ngẫu nhiên, cho dù bạn đang sử dụng Kriging để dự đoán hoặc một số thuật toán khác, đặc tính định lượng của mức độ liên quan được cung cấp bởi variogram là hữu ích để đánh giá bất kỳ thủ tục dự đoán nào . Lưu ý rằng tất cả các phương pháp nội suy không gian là các yếu tố dự đoán theo quan điểm này - và nhiều trong số chúng là các yếu tố dự đoán tuyến tính, chẳng hạn như IDW (Inverse distance weighted). Phép đo có thể được sử dụng để đánh giá giá trị trung bình và độ phân tán (độ lệch chuẩn) của bất kỳ phương pháp nội suy nào. Do đó, nó có khả năng ứng dụng vượt xa việc sử dụng nó trong Kriging.


Cảm ơn bạn đã trả lời chi tiết này. Tôi hỏi cùng một câu hỏi như trên, nếu tôi không thể đưa ra giả định rằng mối tương quan không gian là độc lập với vị trí thì sao? Có đúng không khi mô hình hóa variogram là không hữu ích, vì tôi sẽ phải tạo một mô hình của variogram cho tất cả các vị trí? Có phải sau đó tốt hơn để sử dụng IDW?
Kasper

Khi bạn không thể giả định vị trí thứ hai của quy trình, thì một số tùy chọn bao gồm (1) thu thập nhiều thực hiện của quy trình (khi nó thay đổi theo thời gian); (2) ước tính variogram trên các tiểu vùng địa phương (khi có nhiều dữ liệu); và (3) giả sử một mô hình tham số cho cách thay đổi hình ảnh thay đổi theo vị trí (như trong các mô hình GARCH cho các quy trình 1D). Những bình luận cuối cùng của tôi trực tiếp giải quyết sự bất tiện của việc quay trở lại với một cái gì đó như IDW: bạn có thể ước tính được phương sai hay không , về nguyên tắc nó tồn tại và do đó IDW thường không tối ưu.
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.