Làm thế nào có thể đánh giá khoảng dự đoán của một quá trình Gaussian? Tôi không biết cách ước tính khoảng này mặc dù tôi có thể tìm thấy khoảng tin cậy 95% cho đường trung bình.
Làm thế nào có thể đánh giá khoảng dự đoán của một quá trình Gaussian? Tôi không biết cách ước tính khoảng này mặc dù tôi có thể tìm thấy khoảng tin cậy 95% cho đường trung bình.
Câu trả lời:
Tôi sẽ trả lời câu hỏi của bạn trong khuôn khổ Bayes. Nếu bạn đặc biệt cần một giải pháp thường xuyên, bạn có thể nhận được một bằng cách sửa đổi một chút câu trả lời của tôi, nhưng tôi nghĩ rằng nó sẽ đánh giá thấp sự không chắc chắn thực tế: bạn sẽ cần một cách tiếp cận thường xuyên hoàn toàn, nhưng tôi không biết làm thế nào trong trường hợp cụ thể này .
Để tóm tắt ngắn gọn khung công tác GPR (Gaussian Regression) của Bayesian, bạn giả sử mô hình
trong đó , tức là , các biến hoặc giá trị hàm tiềm ẩn được phân phối dưới dạng Quá trình Gaussian, theo điều kiện trên hyperparameter và là tiếng ồn Gaussian thông thường.
Trên thực tế, cũng là một siêu tham số, vì vậy nó thực sự thuộc về , nhưng tôi muốn nhấn mạnh rằng GPR thường giả định cấu trúc hiệp phương sai tầm thường cho nhiễu.
Phân phối dự báo sau của tại một điểm mới , có điều kiện trên dữ liệu và trên hyperparameter , là . Bây giờ, giả sử rằng hàm trung bình của Quá trình Gaussian bằng 0: trường hợp chung cũng có thể được xử lý, nhưng chúng ta hãy thử và giữ mọi thứ đơn giản. Sau đó, sử dụng máy móc GPR thông thường, chúng tôi nhận được
Ở đâu
tức là, có điều kiện trên dữ liệu quan sát và siêu đường kính, phân bố biến tiềm ẩn tại một điểm mới vẫn là Gaussian, với độ lệch trung bình và độ lệch chuẩn được hiển thị ở trên.
Tuy nhiên, chúng tôi quan tâm đến việc phân phối một quan sát mới , không phải là một biến tiềm ẩn mới. Điều này là dễ dàng bởi vì trong mô hình của chúng tôi, nhiễu là phụ gia, độc lập với tất cả các biến khác và thường được phân phối với giá trị trung bình bằng 0 và phương sai , do đó chúng tôi chỉ cần thêm phương sai nhiễu:
Lưu ý rằng tôi đang xem xét một quan sát mới duy nhất , vì vậy phân phối chỉ là một Gaussian đơn biến và phương sai thực sự là một phương sai chứ không phải là một phương sai ma trận phương sai hiệp phương sai.
Để thực sự sử dụng biểu thức này, bạn cần các giá trị cho các siêu đường kính, không được biết đến. Có 2 cách trong số này:
theo cách tiếp cận Bayes hoàn toàn, bạn không thực sự quan tâm đến , nhưng trong phân phối dự đoán của đưa ra , được lấy bởi sau khi tích hợp các siêu đường kính:
Có hai vấn đề ở đây: được phân phối trước cho các siêu đường kính , sau đó phân phối sau , xuất hiện trong tích phân, là không được biết nhưng phải được bắt nguồn bằng định lý Bayes, mà đối với hầu hết các siêu nhân có nghĩa là phải chạy MCMC. Do đó, chúng tôi không có biểu thức rõ ràng cho , mà chỉ có các mẫu từ MCMC. Và ngay cả khi chúng ta có biểu thức cho , thì tích phân cho vẫn không thể đánh giá ở dạng đóng trong hầu hết các trường hợp. Giải pháp là mô phỏng Bayes phân cấp: cho mỗi mẫu thu được từ với MCMC, bạn vẽ một mẫu từ . Sử dụng các mẫu này để ước tính khoảng HPD cho , và bạn đang ở đó.
Từ quan điểm trực quan, giải pháp thứ hai rút ra các mẫu từ phân phối trong đó các siêu đường kính "không cố định", nhưng được phép thay đổi ngẫu nhiên theo phân phối sau . Do đó, khoảng dự đoán thu được trong trường hợp thứ hai có tính đến độ không đảm bảo do chúng ta thiếu kiến thức về siêu đường kính.
Nếu bạn đang đề cập đến hồi quy Bayes với khả năng Gaussian, phân phối sau của quy trình Gaussian là Gaussian: trong đó là vị trí dữ liệu và là các giá trị dữ liệu và và tính toán với suy luận Bayes: trong đó là vectơ nhân giữa và và với
Do đó, khoảng tin cậy ~ 95% cho chỉ đơn giản là .