Làm thế nào để nội suy Kriging hoạt động?


10

Tôi đang giải quyết một vấn đề trong đó tôi cần sử dụng Kriging để dự đoán giá trị của một số biến dựa trên một số biến xung quanh. Tôi muốn tự thực hiện mã của nó. Vì vậy, tôi đã trải qua quá nhiều tài liệu để hiểu cách thức hoạt động của nó, nhưng tôi đã rất bối rối. Nói chung, tôi hiểu rằng đó là một trung bình có trọng số, nhưng tôi hoàn toàn không thể hiểu được quá trình tính toán trọng số sau đó dự đoán giá trị của một biến.

Bất cứ ai có thể vui lòng giải thích cho tôi bằng các thuật ngữ đơn giản về các khía cạnh toán học của phương pháp nội suy này và cách thức hoạt động của nó?


3
Mã triển khai là một công cụ học tập tuyệt vời nhưng không thể được khuyến nghị để làm việc trên các vấn đề thực tế. Vào thời điểm bạn nhận được mã được viết, gỡ lỗi và kiểm tra, bạn sẽ phát hiện ra nó cần một nỗ lực lớn hơn để cung cấp các công cụ bổ sung cho phân tích dữ liệu khám phá không gian, phương pháp xác thực chéo, xác thực chéo của variogram, tìm kiếm lân cận và đăng bài xử lý các kết quả không mong muốn. Một thỏa hiệp hợp lý và hiệu quả sẽ là bắt đầu với mã làm việc, chẳng hạn như GSLib hoặc GeoRGLM và sửa đổi điều đó.
whuber

Cảm ơn rất nhiều, đó là một ý tưởng tuyệt vời, nhưng tôi cũng muốn hiểu khía cạnh toán học của Kriging, bạn có tài nguyên nào giải thích rõ ràng bằng thuật ngữ đơn giản không? Cảm ơn bạn.
Dania

Câu trả lời:


15

Câu trả lời này bao gồm một phần giới thiệu mà tôi đã viết gần đây cho một bài viết mô tả một phần mở rộng theo thời gian (khiêm tốn) của "Universal Kriging" (Anh), bản thân nó là một khái quát khiêm tốn của "Kriging thông thường". Nó có ba phần phụ: Lý thuyết đưa ra một mô hình thống kê và các giả định; Ước tính đánh giá ngắn gọn ước tính tham số bình phương nhỏ nhất; và Dự đoán cho thấy mức độ phù hợp với khung hình vuông tối thiểu (GLS). Tôi đã nỗ lực để áp dụng ký hiệu quen thuộc với các nhà thống kê, đặc biệt là khách truy cập vào trang web này và sử dụng các khái niệm được giải thích rõ ở đây.

Tóm lại, kuceing là Dự đoán không thiên vị tuyến tính tốt nhất (BLUP) của một trường ngẫu nhiên. Điều này có nghĩa là giá trị dự đoán tại bất kỳ vị trí không ghép nào được lấy dưới dạng kết hợp tuyến tính của các giá trị và hiệp phương sai được quan sát tại các vị trí được lấy mẫu. Giá trị (không xác định, ngẫu nhiên) có mối tương quan giả định với các giá trị mẫu (và các giá trị mẫu được tương quan với nhau). Thông tin tương quan này dễ dàng được dịch thành phương sai của dự đoán. Người ta chọn các hệ số trong tổ hợp tuyến tính ("trọng số giết chết") làm cho phương sai này càng nhỏ càng tốt, tùy thuộc vào điều kiện sai lệch bằng 0 trong dự đoán. Các chi tiết theo sau.


Học thuyết

Vương quốc Anh bao gồm hai thủ tục - một trong những ước tính và một dự đoán khác - được thực hiện trong bối cảnh mô hình GLS cho khu vực nghiên cứu. Mô hình GLS cho rằng dữ liệu mẫu là kết quả của độ lệch ngẫu nhiên xung quanh một xu hướng và các độ lệch đó có tương quan. Xu hướng có nghĩa là theo nghĩa chung của một giá trị có thể được xác định bằng tổ hợp tuyến tính gồm hệ số chưa biết (tham số) . (Trong suốt bài đăng này, số nguyên tố biểu thị hoán vị ma trận và tất cả các vectơ được coi là vectơ cột.)p β = ( β 1 , β 2 , ... , β p ) ' 'zi, (i=1,2,...,n)pβ=(β1,β2,,βp)

Tại bất kỳ vị trí nào trong khu vực nghiên cứu đều có sẵn một bộ các thuộc tính số được gọi là các biến độc lập của hay biến đổi. (Thông thường là thuật ngữ không đổi của người dùng và có thể là tọa độ không gian và bổ sung có thể biểu thị thông tin không gian cũng như thông tin phụ trợ khác có sẵn tại tất cả các vị trí trong khu vực nghiên cứu, như độ xốp của một tầng chứa nước hoặc khoảng cách đến giếng bơm.) Tại mỗi vị trí dữ liệu , ngoài các đồng biến của nó , quan sát liên quany 1 = 1 y 2 y 3 y i iy=(y1,y2,,yp)y1=1y2y3yiiz i Z i y i y i Z iyi=(yi1,yi2,,yip)ziđược coi là hiện thực hóa một biến ngẫu nhiên . Ngược lại, được coi là các giá trị được xác định bằng cách hoặc đặc trưng cho các điểm hoặc các vùng nhỏ được biểu thị bằng các quan sát (dữ liệu mà hỗ trợ. Các đang không được coi là chứng ngộ của các biến ngẫu nhiên và bắt buộc phải được liên quan đến các tính chất của bất kỳ .ZiyiyiZi

Kết hợp tuyến tính biểu thị giá trị mong đợi của theo các tham số , là giá trị của xu hướng tại vị trí . Quá trình ước tính sử dụng dữ liệu để tìm các giá trị đại diện cho các tham số chưa biết , trong khi quá trình dự đoán sử dụng dữ liệu tại các vị trí để tính giá trị tại một vị trí không được lấy mẫu , ở đây được lập chỉ mục là . Các mục tiêu của ước tính là cố định ( nghĩa làZ i β i β i β i i = 1 , 2 , ... , n i = 0 z 0 y 0 β 0

E[Zi]=yiβ=yi1β1+yi2β2++yipβp
Ziβiβ^iβii=1,2,,ni=0, tham số không ngẫu nhiên) trong khi mục tiêu dự đoán là ngẫu nhiên, bởi vì giá trị bao gồm một dao động ngẫu nhiên xung quanh xu hướng của nó . Thông thường, dự đoán được thực hiện cho nhiều vị trí sử dụng cùng một dữ liệu bằng cách thay đổi vị trí . Ví dụ, các dự đoán thường được thực hiện để vạch ra một bề mặt dọc theo một lưới các điểm thông thường phù hợp với đường viền. z0y0β0

Ước lượng

cổ điển giả định các dao động ngẫu nhiên có giá trị kỳ vọng bằng 0 và hiệp phương sai của chúng được biết đến. Viết hiệp phương sai giữa và là . Sử dụng hiệp phương sai này, ước tính được thực hiện bằng GLS. Giải pháp của nó là như sau: trong đó là -vector của các quan sát, (ma trận thiết kế Ma- ) là ma trận bởi có các hàng là vectơZ i Z j c i j β = H z , H =ZiZiZjcijinC=(c i j )n

β^=Hz, H=(YC1Y)1YC1
n Y =( y i j )np y i ,1z=(z1,z2,,zn)nY=(yij)npyi,1in , và là -by- ma trận hiệp phương sai được giả định là khả nghịch (Draper & Smith (1981), phần 2.11) . Các bởi ma trận , mà dự án dữ liệu vào dự toán tham số , được gọi là “ma trận mũ.” Công thức của là ứng dụng của ma trận mũ cho dữ liệu cho thấy rõ cách các ước tính tham số phụ thuộc tuyến tính vào dữ liệu. Hiệp phương saiC=(cij)np n H z beta beta C = ( c i j )npnHzβ^β^C=(cij) được tính toán một cách cổ điển bằng cách sử dụng một phép đo biến thiên cho phép hiệp phương sai về vị trí dữ liệu, mặc dù việc tính hiệp phương sai thực sự được tính toán là không quan trọng.

Sự dự đoán

Vương quốc Anh tương tự dự đoán bằng phương pháp kết hợp tuyến tính của dữ liệu Các được gọi là “trọng lượng Kriging” cho dự đoán của . Vương quốc Anh hoàn thành dự đoán này của bằng cách đáp ứng hai tiêu chí. Đầu tiên, dự đoán không thiên vị, được thể hiện bằng cách yêu cầu tổ hợp tuyến tính của các biến ngẫu nhiên bằng trung bình: Kỳ vọng này được thực hiện trên khớpz 0 = λ 1 z 1 + λ 2 z 2 + 1 Z 0 Z =z0λ i z 0 z 0 Z i ( Z 1 , Z 2 , ... , Z n ) 0 = E [ λ ' Z - Z

z^0=λ1z1+λ2z2++λnzn=λz.
λiz0z0Zi 0 = E [ Z 0 - Z 0 ] = E [ λ ' Z - Z 0 ] . n +Z0
0=E[Z^0Z0]=E[λZZ0].
n+1-Phân phối phân phối của và . Độ tuyến tính của kỳ vọng cùng với giả định xu hướng (1) ngụ ý: Z0Z=(Z1,Z2,,Zn)
0=E[λZZ0]=λE[Z]E[Z0]=λ(Yβ)y0β=(λYy0)β=β(Yλy0)

không có vấn đề gì có thể. Đây sẽ là trường hợp cung cấp rằngβ

Y^λ=y0.

Trong số tất cả các giải pháp khả thi của hệ phương trình chưa xác định này, Vương quốc Anh chọn để giảm thiểu phương sai của lỗi dự đoán . Theo nghĩa này, Vương quốc Anh là người giỏi nhất trong số tất cả các dự đoán tuyến tính không thiên vị. Vì mối quan hệ cuối cùng này ngụ ý lỗi dự đoán là trung bình bằng 0, phương sai chỉ đơn giản là kỳ vọng của lỗi dự đoán bình phương: trong đó là vectơ hiệp phương sai giữaZ 0 - Z 0 V một r ( Z 0 - Z 0λZ^0Z0

Var(Z^0Z0)=E[(Z^0Z0)2]=E[(λZZ0)2]=c002λc0+λCλ
c0=(c01,c02,,c0n)Z0và và là phương sai của . Zi, i1c00Z0

Để giảm thiểu phương sai, phân biệt đối với và giới thiệu một vector của Lagrange multiplier để kết hợp vào chế . Điều này mang lại một hệ phương trình tuyến tính , được viết dưới dạng khối ma trận là trong đó đại diện cho bởip μ Y ' λ = y 0 n + p ( C Y Y ' 0 ) ( λ μ ) = ( c 0λpμY^λ=y0n+p0pp1n

(CYY0)(λμ)=(c0y0)
0ppma trận các số không. Viết cho theo ma trận danh tính , giải pháp duy nhất cho được đưa ra bởi 1nnλ
λ=Hy0+C1(1YH)c0.

(Người đọc quen thuộc với hồi quy bội có thể thấy được việc so sánh giải pháp này với giải pháp dựa trên hiệp phương sai của bình phương nhỏ nhất bình thường , trông gần giống nhau, nhưng không có thuật ngữ nhân Lagrange.)

Mối quan hệ này thể hiện các trọng số gây sát thương, , là tổng của một thuật ngữ chỉ phụ thuộc vào ma trận mũ và hiệp phương sai tại vị trí dự đoán , cộng với một thuật ngữ phụ thuộc vào hiệp phương sai trong số các dữ liệu và dự đoán, . Việc thay thế nó vào phía bên phải của phương trình phương sai sẽ tạo ra phương sai dự đoán sai lầm, có thể được sử dụng để xây dựng các giới hạn dự đoán xung quanh .λ Z 0 z 0[Hy0]Z0z^0


1
Cảm ơn bạn rất nhiều, đây chính xác là những gì tôi đang tìm kiếm. Bạn đã giải quyết vấn đề này cho tôi, bây giờ tôi hiểu Kriging. Tôi thực sự đánh giá cao sự giúp đỡ của bạn, cảm ơn rất nhiều.
Dania

Giải thích tuyệt vời. Một câu hỏi: thể hiện điều gì? Nó được định nghĩa như thế nào? Nó là một phần của quà tặng? Nguyên tố có nghĩa là gì? Biến này được giới thiệu mà không được xác định, vì vậy tôi hơi bối rối về định nghĩa của nó. Y^
DW

@DW Các số nguyên tố biểu thị chuyển vị trong suốt bài này. Do đó, lấy chuyển vị của định nghĩa trong câu trả lời, chúng ta có thể mô tả ma trận này là " là ma trận by có các cột là vectơ . " Do đó nó đóng gói các tập dữ liệu của hiệp phương sai. pn y i ,1inY=(yji)pnyi,1in
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.