Khoảng dự đoán quá trình Gaussian


7

Làm thế nào có thể đánh giá khoảng dự đoán của một quá trình Gaussian? Tôi không biết cách ước tính khoảng này mặc dù tôi có thể tìm thấy khoảng tin cậy 95% cho đường trung bình.


1
Mục tiêu của bất kỳ khoảng dự đoán nào là giá trị của một biến ngẫu nhiên cụ thể. Những biến ngẫu nhiên nào bạn có trong tâm trí?
whuber

biến là y hat cho một x mới không được bao gồm trong các điểm deisgn
Wis

Ý của bạn là như trong stats.stackexchange.com/questions/33433/ ((nơi @gung đã cung cấp câu trả lời chi tiết)? Hoặc có lẽ cài đặt chung hơn theo địa chỉ của Rob Hyndman tại stats.stackexchange.com/a/9144 ?
whuber

1
@ raK1 Rõ ràng là tùy thuộc vào bạn bởi vì đó là câu hỏi của bạn nhưng tôi nghĩ DeltalV xứng đáng nhận được tiền thưởng cho một câu trả lời tuyệt vời vì vậy nếu bạn đồng ý thì sẽ cần chấp nhận trước ngày mai khi hết tiền. Chỉ cần một cái đầu lên :) chúc mừng!
EHH

Câu trả lời:


12

Tôi sẽ trả lời câu hỏi của bạn trong khuôn khổ Bayes. Nếu bạn đặc biệt cần một giải pháp thường xuyên, bạn có thể nhận được một bằng cách sửa đổi một chút câu trả lời của tôi, nhưng tôi nghĩ rằng nó sẽ đánh giá thấp sự không chắc chắn thực tế: bạn sẽ cần một cách tiếp cận thường xuyên hoàn toàn, nhưng tôi không biết làm thế nào trong trường hợp cụ thể này .

Để tóm tắt ngắn gọn khung công tác GPR (Gaussian Regression) của Bayesian, bạn giả sử mô hình

y=f(x|θ)+ϵ

trong đó , tức là , các biến hoặc giá trị hàm tiềm ẩn được phân phối dưới dạng Quá trình Gaussian, theo điều kiện trên hyperparameter và là tiếng ồn Gaussian thông thường.f(x|θ)GP(μ(x|θ),k(x,x|θ)) θϵN(0,σ2)


Trên thực tế, cũng là một siêu tham số, vì vậy nó thực sự thuộc về , nhưng tôi muốn nhấn mạnh rằng GPR thường giả định cấu trúc hiệp phương sai tầm thường cho nhiễu.σ2θ


Phân phối dự báo sau của tại một điểm mới , có điều kiện trên dữ liệu và trên hyperparameter , là . Bây giờ, giả sử rằng hàm trung bình của Quá trình Gaussian bằng 0: trường hợp chung cũng có thể được xử lý, nhưng chúng ta hãy thử và giữ mọi thứ đơn giản. Sau đó, sử dụng máy móc GPR thông thường, chúng tôi nhận đượcyx{(x1,y1,),(xd,yd)}=(x,y)θp(y|θ,y)

p(f|θ,y)=N(kT(K+σ2I)1y,k(x,x)kT(K+σ2I)1k)

Ở đâu

K=(k(x1,x1;θ)k(x1,xd;θ)k(x1,xd;θ)k(xd,xd;θ))

k=(k(x,x1;θ)k(x,xd;θ))

tức là, có điều kiện trên dữ liệu quan sát và siêu đường kính, phân bố biến tiềm ẩn tại một điểm mới vẫn là Gaussian, với độ lệch trung bình và độ lệch chuẩn được hiển thị ở trên.

Tuy nhiên, chúng tôi quan tâm đến việc phân phối một quan sát mới , không phải là một biến tiềm ẩn mới. Điều này là dễ dàng bởi vì trong mô hình của chúng tôi, nhiễu là phụ gia, độc lập với tất cả các biến khác và thường được phân phối với giá trị trung bình bằng 0 và phương sai , do đó chúng tôi chỉ cần thêm phương sai nhiễu:yσ2

p(y|θ,y)=N(kT(K+σ2I)1y,k(x,x)kT(K+σ2I)1k+σ2)

Lưu ý rằng tôi đang xem xét một quan sát mới duy nhất , vì vậy phân phối chỉ là một Gaussian đơn biến và phương sai thực sự là một phương sai chứ không phải là một phương sai ma trận phương sai hiệp phương sai.yp(y|θ,y)

Để thực sự sử dụng biểu thức này, bạn cần các giá trị cho các siêu đường kính, không được biết đến. Có 2 cách trong số này:

  1. (giải pháp phổ biến nhất) các siêu đường kính được ước tính bằng MLE hoặc MAP và biểu thức trên được sử dụng. Cách tiếp cận này hoàn toàn bỏ qua sự không chắc chắn trong ước tính của siêu đường kính, do đó nó có vẻ không an toàn lắm.
  2. theo cách tiếp cận Bayes hoàn toàn, bạn không thực sự quan tâm đến , nhưng trong phân phối dự đoán của đưa ra , được lấy bởi sau khi tích hợp các siêu đường kính:p(y|θ,y)yyp(y|θ,y)

    p(y|y)=p(y,θ|y)dθ=p(y|θ,y)p(θ|y)dθ

Có hai vấn đề ở đây: được phân phối trước cho các siêu đường kính , sau đó phân phối sau , xuất hiện trong tích phân, là không được biết nhưng phải được bắt nguồn bằng định lý Bayes, mà đối với hầu hết các siêu nhân có nghĩa là phải chạy MCMC. Do đó, chúng tôi không có biểu thức rõ ràng cho , mà chỉ có các mẫu từ MCMC. Và ngay cả khi chúng ta có biểu thức cho , thì tích phân cho vẫn không thể đánh giá ở dạng đóng trong hầu hết các trường hợp. Giải pháp là mô phỏng Bayes phân cấp: cho mỗi mẫup(θ)p(θ|y)p(θ|y)p(θ|y)p(y|y)θ^i thu được từ với MCMC, bạn vẽ một mẫu từ . Sử dụng các mẫu này để ước tính khoảng HPD cho , và bạn đang ở đó.p(θ|y)yip(y|θ^i,y)myiy

Từ quan điểm trực quan, giải pháp thứ hai rút ra các mẫu từ phân phối trong đó các siêu đường kính "không cố định", nhưng được phép thay đổi ngẫu nhiên theo phân phối sau . Do đó, khoảng dự đoán thu được trong trường hợp thứ hai có tính đến độ không đảm bảo do chúng ta thiếu kiến ​​thức về siêu đường kính.p(θ|y)


Xin lỗi với nitpick nhưng bạn có thể vui lòng giải thích ngắn gọn trong câu trả lời về cách thức thu được công thức dự đoán, như bạn đã làm trong các bình luận cho câu trả lời khác, điều này sẽ làm cho câu trả lời tự có và hữu ích cho bất kỳ ai tìm kiếm nó trong tương lai. Thảo luận tuyệt vời về các vấn đề siêu tham số btw! Cảm ơn :)
EHH

@EHH không có vấn đề gì, tôi đã thêm bit mà bạn đang đề cập đến.
DeltaIV

1
@DeltalV Tuyệt vời, điều này thực sự đã giúp tôi dọn dẹp một số thứ mà tôi đang tự hỏi! Cảm ơn!
EHH

@ Mathews24 đó là một câu hỏi khác và chính sách CV là một câu hỏi cho mỗi bài đăng. Tìm kiếm trang web để xem nếu một câu hỏi như vậy đã được hỏi, nếu không hãy tự hỏi một câu hỏi mới.
DeltaIV

@DeltaIV Bạn nói rằng "chúng tôi quan tâm đến việc phân phối một quan sát mới ". Tôi cho rằng nó phụ thuộc vào ngữ cảnh, nhưng có bất kỳ quy tắc chung nào khi người ta quan tâm đến so với không? Giải thích vật lý cho gì? Ví dụ: nếu tương ứng với các phép đo từ chẩn đoán có một số lỗi , thì việc không thể mô hình hóa thực sự mang lại cho chúng ta mô hình cho hiện tượng vật lý cơ bản không? Tại sao chúng ta lại thích trong trường hợp này? yyffyσfy
Mathews24

2

Nếu bạn đang đề cập đến hồi quy Bayes với khả năng Gaussian, phân phối sau của quy trình Gaussian là Gaussian: trong đó là vị trí dữ liệu và là các giá trị dữ liệu và và tính toán với suy luận Bayes: trong đó là vectơ nhân giữa và và với

p(f(x)Xn,Yn)=N(μn(x),σn2(x)),
XnYnμnσn2
μn(x)=kn(x)Cn1Yn and σn2(x)=k(x,x)kn(x)Cn1kn(x),
kn(x)=[k(xt,x)]xtXnxXnCn=Kn+η2Iη2 độ lệch chuẩn của nhiễu quan sát và ma trận hạt nhân (xem chương thứ hai của Rasmussen và Cuốn sách của Williams ).Kn=[k(xt,xt)]xt,xtXn

Do đó, khoảng tin cậy ~ 95% cho chỉ đơn giản là .xμn(x)±2σn(x)


1
Có vẻ như bạn đang giả sử (a) OP muốn có khoảng dự đoán Bayes và (b) sẵn sàng chấp nhận một liên hợp Bình thường trước cho quá trình.
whuber

1
Thật. Tôi bao gồm những giả định trong câu trả lời của tôi.
Emile

Làm thế nào bạn có thể tìm thấy σ2n (x)? Bạn có biết phương trình cho nó. Cảm ơn bạn
Wis

2
Câu trả lời này là hoàn toàn sai. OP nói rằng họ biết cách lấy các khoảng tin cậy, nhưng muốn có được các khoảng dự đoán là khoảng xác suất 95% cho quan sát trong tương lai . Tôi khuyên bạn nên @ raK1 loại bỏ đây là câu trả lời được chấp nhận. with noise
EHH

1
@DeltaIV Tôi tin rằng phương sai đo lường trong tương lai là tổng của hàm cộng với phương sai tạp âm là câu trả lời mà OP đang tìm kiếm (tôi nghĩ có thể là thế này nhưng đã không tìm thấy tài liệu tham khảo cho nó và vì vậy tôi hy vọng ai đó chắc chắn để trả lời) vì vậy bạn có thể nên viết nó như một câu trả lời cho câu hỏi. Về điểm khác của bạn, tôi hoàn toàn đồng ý rằng giả sử siêu âm được biết là đánh giá thấp sự không chắc chắn, tuy nhiên thực tế đây là những gì được thực hiện khi áp dụng GP trong thực tế nên tôi đã trả lời trong bối cảnh đó.
EHH
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.