Câu trả lời này bao gồm một phần giới thiệu mà tôi đã viết gần đây cho một bài viết mô tả một phần mở rộng theo thời gian (khiêm tốn) của "Universal Kriging" (Anh), bản thân nó là một khái quát khiêm tốn của "Kriging thông thường". Nó có ba phần phụ: Lý thuyết đưa ra một mô hình thống kê và các giả định; Ước tính đánh giá ngắn gọn ước tính tham số bình phương nhỏ nhất; và Dự đoán cho thấy mức độ phù hợp với khung hình vuông tối thiểu (GLS). Tôi đã nỗ lực để áp dụng ký hiệu quen thuộc với các nhà thống kê, đặc biệt là khách truy cập vào trang web này và sử dụng các khái niệm được giải thích rõ ở đây.
Tóm lại, kuceing là Dự đoán không thiên vị tuyến tính tốt nhất (BLUP) của một trường ngẫu nhiên. Điều này có nghĩa là giá trị dự đoán tại bất kỳ vị trí không ghép nào được lấy dưới dạng kết hợp tuyến tính của các giá trị và hiệp phương sai được quan sát tại các vị trí được lấy mẫu. Giá trị (không xác định, ngẫu nhiên) có mối tương quan giả định với các giá trị mẫu (và các giá trị mẫu được tương quan với nhau). Thông tin tương quan này dễ dàng được dịch thành phương sai của dự đoán. Người ta chọn các hệ số trong tổ hợp tuyến tính ("trọng số giết chết") làm cho phương sai này càng nhỏ càng tốt, tùy thuộc vào điều kiện sai lệch bằng 0 trong dự đoán. Các chi tiết theo sau.
Học thuyết
Vương quốc Anh bao gồm hai thủ tục - một trong những ước tính và một dự đoán khác - được thực hiện trong bối cảnh mô hình GLS cho khu vực nghiên cứu. Mô hình GLS cho rằng dữ liệu mẫu là kết quả của độ lệch ngẫu nhiên xung quanh một xu hướng và các độ lệch đó có tương quan. Xu hướng có nghĩa là theo nghĩa chung của một giá trị có thể được xác định bằng tổ hợp tuyến tính gồm hệ số chưa biết (tham số) . (Trong suốt bài đăng này, số nguyên tố biểu thị hoán vị ma trận và tất cả các vectơ được coi là vectơ cột.)p β = ( β 1 , β 2 , ... , β p ) ' 'zi, (i=1,2,...,n)pβ=(β1,β2,…,βp)′′
Tại bất kỳ vị trí nào trong khu vực nghiên cứu đều có sẵn một bộ các thuộc tính số được gọi là các biến độc lập của hay biến đổi. (Thông thường là thuật ngữ không đổi của người dùng và có thể là tọa độ không gian và bổ sung có thể biểu thị thông tin không gian cũng như thông tin phụ trợ khác có sẵn tại tất cả các vị trí trong khu vực nghiên cứu, như độ xốp của một tầng chứa nước hoặc khoảng cách đến giếng bơm.) Tại mỗi vị trí dữ liệu , ngoài các đồng biến của nó , quan sát liên quany 1 = 1 y 2 y 3 y i iy=(y1,y2,…,yp)′y1=1y2y3yiiz i Z i y i y i Z iyi=(yi1,yi2,…,yip)′ziđược coi là hiện thực hóa một biến ngẫu nhiên . Ngược lại, được coi là các giá trị được xác định bằng cách hoặc đặc trưng cho các điểm hoặc các vùng nhỏ được biểu thị bằng các quan sát (dữ liệu mà hỗ trợ. Các đang không được coi là chứng ngộ của các biến ngẫu nhiên và bắt buộc phải được liên quan đến các tính chất của bất kỳ .ZiyiyiZi
Kết hợp tuyến tính
biểu thị giá trị mong đợi của theo các tham số , là giá trị của xu hướng tại vị trí . Quá trình ước tính sử dụng dữ liệu để tìm các giá trị đại diện cho các tham số chưa biết , trong khi quá trình dự đoán sử dụng dữ liệu tại các vị trí để tính giá trị tại một vị trí không được lấy mẫu , ở đây được lập chỉ mục là . Các mục tiêu của ước tính là cố định ( nghĩa làZ i β i β i β i i = 1 , 2 , ... , n i = 0 z 0 y ′ 0 β 0
E[Zi]=y′iβ=yi1β1+yi2β2+⋯+yipβp
Ziβiβ^iβii=1,2,…,ni=0, tham số không ngẫu nhiên) trong khi mục tiêu dự đoán là ngẫu nhiên, bởi vì giá trị bao gồm một dao động ngẫu nhiên xung quanh xu hướng của nó . Thông thường, dự đoán được thực hiện cho nhiều vị trí sử dụng cùng một dữ liệu bằng cách thay đổi vị trí . Ví dụ, các dự đoán thường được thực hiện để vạch ra một bề mặt dọc theo một lưới các điểm thông thường phù hợp với đường viền.
z0y′0β0
Ước lượng
cổ điển giả định các dao động ngẫu nhiên có giá trị kỳ vọng bằng 0 và hiệp phương sai của chúng được biết đến. Viết hiệp phương sai giữa và là . Sử dụng hiệp phương sai này, ước tính được thực hiện bằng GLS. Giải pháp của nó là như sau:
trong đó là -vector của các quan sát, (ma trận thiết kế Ma- ) là ma trận bởi có các hàng là vectơZ i Z j c i j β = H z , H =ZiZiZjcij ≤i≤nC=(c i j )n
β^=Hz, H=(Y′C−1Y)−1Y′C−1
n Y =( y i j )np y ′ i ,1z=(z1,z2,…,zn)nY=(yij)npy′i,1≤i≤n , và là -by- ma trận hiệp phương sai được giả định là khả nghịch (Draper & Smith (1981), phần 2.11) . Các bởi ma trận , mà dự án dữ liệu vào dự toán tham số , được gọi là “ma trận mũ.” Công thức của là ứng dụng của ma trận mũ cho dữ liệu cho thấy rõ cách các ước tính tham số phụ thuộc tuyến tính vào dữ liệu. Hiệp phương sai
C=(cij)np n H z beta beta C = ( c i j )npnHzβ^β^C=(cij) được tính toán một cách cổ điển bằng cách sử dụng một phép đo biến thiên cho phép hiệp phương sai về vị trí dữ liệu, mặc dù việc tính hiệp phương sai thực sự được tính toán là không quan trọng.
Sự dự đoán
Vương quốc Anh tương tự dự đoán bằng phương pháp kết hợp tuyến tính của dữ liệu
Các được gọi là “trọng lượng Kriging” cho dự đoán của . Vương quốc Anh hoàn thành dự đoán này của bằng cách đáp ứng hai tiêu chí. Đầu tiên, dự đoán không thiên vị, được thể hiện bằng cách yêu cầu tổ hợp tuyến tính của các biến ngẫu nhiên bằng trung bình:
Kỳ vọng này được thực hiện trên khớpz 0 = λ 1 z 1 + λ 2 z 2 + ⋯ 1 Z 0 Z =z0λ i z 0 z 0 Z i ( Z 1 , Z 2 , ... , Z n ) 0 = E [ λ ' Z - Z
z^0=λ1z1+λ2z2+⋯+λnzn=λ′z.
λiz0z0Zi 0 = E [ Z 0 - Z 0 ] = E [ λ ' Z - Z 0 ] . n +Z00=E[Z^0−Z0]=E[λ′Z−Z0].
n+1-Phân phối phân phối của và . Độ tuyến tính của kỳ vọng cùng với giả định xu hướng (1) ngụ ý:
Z0Z=(Z1,Z2,…,Zn)0=E[λ′Z−Z0]=λ′E[Z]−E[Z0]=λ′(Yβ)−y′0β=(λ′Y−y′0)β=β′(Y′λ−y0)
không có vấn đề gì có thể. Đây sẽ là trường hợp cung cấp rằngβ
Y^′λ=y0.
Trong số tất cả các giải pháp khả thi của hệ phương trình chưa xác định này, Vương quốc Anh chọn để giảm thiểu phương sai của lỗi dự đoán . Theo nghĩa này, Vương quốc Anh là người giỏi nhất trong số tất cả các dự đoán tuyến tính không thiên vị. Vì mối quan hệ cuối cùng này ngụ ý lỗi dự đoán là trung bình bằng 0, phương sai chỉ đơn giản là kỳ vọng của lỗi dự đoán bình phương:
trong đó là vectơ hiệp phương sai giữaZ 0 - Z 0 V một r ( Z 0 - Z 0λZ^0−Z0
Var(Z^0−Z0)=E[(Z^0−Z0)2]=E[(λ′Z−Z0)2]=c00−2λ′c0+λ′Cλ
c0=(c01,c02,…,c0n)′Z0và và là phương sai của .
Zi, i≥1c00Z0
Để giảm thiểu phương sai, phân biệt đối với và giới thiệu một vector của Lagrange multiplier để kết hợp vào chế . Điều này mang lại một hệ phương trình tuyến tính , được viết dưới dạng khối ma trận là
trong đó đại diện cho bởip μ Y ' λ = y 0 n + p ( C Y Y ' 0 ) ( λ μ ) = ( c 0λpμY^′λ=y0n+p0pp1n
(CY′Y0)(λμ)=(c0y0)
0ppma trận các số không. Viết cho theo ma trận danh tính , giải pháp duy nhất cho được đưa ra bởi
1nnλλ=H′y0+C−1(1−YH)c0.
(Người đọc quen thuộc với hồi quy bội có thể thấy được việc so sánh giải pháp này với giải pháp dựa trên hiệp phương sai của bình phương nhỏ nhất bình thường , trông gần giống nhau, nhưng không có thuật ngữ nhân Lagrange.)
Mối quan hệ này thể hiện các trọng số gây sát thương, , là tổng của một thuật ngữ chỉ phụ thuộc vào ma trận mũ và hiệp phương sai tại vị trí dự đoán , cộng với một thuật ngữ phụ thuộc vào hiệp phương sai trong số các dữ liệu và dự đoán, . Việc thay thế nó vào phía bên phải của phương trình phương sai sẽ tạo ra phương sai dự đoán sai lầm, có thể được sử dụng để xây dựng các giới hạn dự đoán xung quanh .λ Z 0 z 0[H′y0]Z0z^0