Tôi đang làm việc với một vấn đề suy luận chiều cao (khoảng 2000 tham số mô hình) mà chúng tôi có thể thực hiện mạnh mẽ ước tính MAP bằng cách tìm mức tối đa toàn cầu của log-posterior bằng cách sử dụng kết hợp tối ưu hóa dựa trên độ dốc và thuật toán di truyền.
Tôi rất muốn có thể đưa ra một số ước tính về độ không đảm bảo trên các tham số mô hình ngoài việc tìm ước tính MAP.
Chúng tôi có thể tính toán hiệu quả độ dốc của log-posterior liên quan đến các tham số, vì vậy, về lâu dài chúng tôi đang nhắm đến việc sử dụng Hamilton MCMC để thực hiện một số mẫu, nhưng hiện tại tôi quan tâm đến các ước tính không lấy mẫu.
Cách tiếp cận duy nhất tôi biết là tính toán nghịch đảo của Hessian ở chế độ để xấp xỉ hậu thế là đa biến thông thường, nhưng ngay cả điều này dường như không khả thi đối với một hệ thống lớn như vậy, ngay cả khi chúng ta tính toán các yếu tố của Hessian Tôi chắc chắn chúng ta không thể tìm thấy nghịch đảo của nó.
Bất cứ ai có thể đề nghị loại phương pháp thường được sử dụng trong các trường hợp như thế này?
Cảm ơn!
EDIT - thông tin bổ sung về vấn đề
Bối cảnh
Đây là một vấn đề nghịch đảo liên quan đến một thí nghiệm vật lý lớn. Chúng ta có một lưới tam giác 2D mô tả một số trường vật lý và các tham số mô hình của chúng ta là các giá trị vật lý của các trường đó ở mỗi đỉnh của lưới. Lưới có khoảng 650 đỉnh và chúng tôi mô hình 3 trường, do đó, đó là nơi 2000 tham số mô hình của chúng tôi đến từ.
Dữ liệu thử nghiệm của chúng tôi là từ các công cụ không đo trực tiếp các trường này, nhưng số lượng là các hàm phi tuyến tính phức tạp của các trường. Đối với mỗi công cụ khác nhau, chúng tôi có một mô hình chuyển tiếp ánh xạ các tham số mô hình theo dự đoán của dữ liệu thử nghiệm và so sánh giữa dự đoán và phép đo mang lại khả năng ghi nhật ký.
Sau đó, chúng tôi tổng hợp khả năng đăng nhập từ tất cả các công cụ khác nhau này và cũng thêm một số giá trị trước nhật ký áp dụng một số ràng buộc vật lý cho các trường.
Do đó, tôi nghi ngờ 'mô hình' này nằm gọn trong một danh mục - chúng tôi không có lựa chọn mô hình đó là gì, nó được quyết định bởi cách thức các công cụ thực tế thu thập dữ liệu thử nghiệm của chúng tôi.
Tập dữ liệu
Tập dữ liệu được tạo thành từ 500x500 hình ảnh và có một hình ảnh cho mỗi camera nên tổng số điểm dữ liệu là 500x500x4 = .
Mô hình lỗi
Chúng tôi nhận tất cả các lỗi trong vấn đề là Gaussian tại thời điểm này. Tại một số điểm, tôi có thể cố gắng chuyển sang mô hình lỗi của sinh viên chỉ để linh hoạt hơn, nhưng mọi thứ dường như vẫn hoạt động tốt chỉ với Gaussian.
Ví dụ về khả năng
Đây là một thí nghiệm vật lý plasma và phần lớn dữ liệu của chúng tôi đến từ các máy ảnh hướng vào plasma với các bộ lọc cụ thể trước ống kính để chỉ nhìn vào các phần cụ thể của phổ ánh sáng.
Để tái tạo dữ liệu có hai bước; đầu tiên chúng ta phải mô hình hóa ánh sáng phát ra từ plasma trên lưới, sau đó chúng ta phải mô hình hóa ánh sáng đó trở lại hình ảnh camera.
Việc mô hình hóa ánh sáng phát ra từ plasma không may phụ thuộc vào hệ số tốc độ hiệu quả, cho biết mức độ phát ra của các quá trình khác nhau được đưa ra trong các trường. Các tỷ lệ này được dự đoán bởi một số mô hình số đắt tiền, vì vậy chúng tôi phải lưu trữ đầu ra của chúng trên các lưới và sau đó nội suy để tìm kiếm các giá trị. Dữ liệu hàm tốc độ chỉ được tính một lần - chúng tôi lưu trữ dữ liệu sau đó xây dựng một spline từ nó khi mã khởi động, và sau đó spline đó được sử dụng cho tất cả các đánh giá hàm.
Giả sử và là các hàm tốc độ (mà chúng ta đánh giá bằng phép nội suy), sau đó phát xạ ở đỉnh thứ của lưới được đưa ra bởi
trong đó là 3 trường chúng ta lập mô hình trên lưới. Dễ dàng đưa vectơ phát xạ vào hình ảnh camera, chỉ cần nhân với ma trận để mã hóa các phần của lưới mà mỗi pixel camera nhìn qua.
Vì các lỗi là Gaussian, nên khả năng đăng nhập cho máy ảnh cụ thể này là
trong đó là dữ liệu camera. Tổng khả năng ghi nhật ký là tổng của 4 biểu thức trên nhưng đối với các máy ảnh khác nhau, tất cả đều có các phiên bản khác nhau của các hàm tốc độ vì chúng nhìn vào các phần khác nhau của phổ ánh sáng.
Ví dụ trước
Chúng tôi có nhiều linh mục khác nhau, chỉ thực sự đặt giới hạn trên và dưới nhất định cho các đại lượng khác nhau, nhưng những người này có xu hướng không hành động quá mạnh mẽ vào vấn đề. Chúng tôi có một ưu tiên hành động mạnh mẽ, áp dụng hiệu quả việc làm mịn kiểu Laplacian cho các trường. Nó cũng có dạng Gaussian: