Tôi đang đọc một bài viết giới thiệu tuyệt vời về HMC của Giáo sư Michael Betancourt, nhưng bị mắc kẹt trong việc hiểu làm thế nào để chúng ta đi về sự lựa chọn phân phối động lượng.
Tóm lược
Ý tưởng cơ bản của HMC là giới thiệu biến động lượng kết hợp với biến mục tiêu . Chúng cùng tạo thành một không gian pha .q
Tổng năng lượng của một hệ thống bảo thủ là một hằng số và hệ thống phải tuân theo các phương trình của Hamilton. Do đó, các quỹ đạo trong không gian pha có thể bị phân hủy thành các mức năng lượng , mỗi mức tương ứng với một giá trị năng lượng và có thể được mô tả như một tập hợp các điểm thỏa mãn:
.
Chúng tôi muốn ước tính phân phối chung , để bằng cách tích hợp chúng tôi có được phân phối mục tiêu mong muốn . Hơn nữa, có thể được viết tương đương là , trong đó tương ứng với một giá trị cụ thể của năng lượng và là vị trí trên mức năng lượng đó.p π ( q ) π ( q , p ) π ( θ EE θ E
Đối với một giá trị đã cho của , tương đối dễ biết hơn, vì chúng ta có thể thực hiện tích hợp các phương trình của Hamilton để lấy điểm dữ liệu trên quỹ đạo . Tuy nhiên, là phần khó khăn mà phụ thuộc vào cách chúng ta xác định đà, mà sau đó xác định năng lượng tổng .π ( θ Eπ ( E ) E
Câu hỏi
Dường như với tôi rằng những gì chúng ta theo sau là , nhưng thực tế chúng ta có thể ước tính là , dựa trên giả định rằng có thể gần giống với , như được minh họa trong hình 23 của bài báo. Tuy nhiên, những gì chúng tôi thực sự lấy mẫu dường như là .π ( Eπ ( Eπ ( E ) π ( p
Q1 : Có phải vì khi chúng ta biết , chúng ta có thể dễ dàng tính toán và do đó ước tính ?E π ( E
Để đưa ra giả định rằng giữ, chúng tôi sử dụng động lượng phân tán Gaussian. Hai lựa chọn được đề cập trong bài báo:
Trong đó là hằng số được gọi là số liệu Euclide, hay còn gọi là ma trận khối .D × D
Trong trường hợp lựa chọn đầu tiên (Euclidean-Gaussian), ma trận khối thực sự độc lập với , vì vậy xác suất chúng tôi đang lấy mẫu thực sự là . Sự lựa chọn động lượng phân phối Gaussian với hiệp phương sai ngụ ý rằng biến mục tiêu là phân phối Gaussian với ma trận hiệp phương sai , vì và cần phải được biến đổi nghịch đảo để giữ cho âm lượng trong không gian pha không đổi .q π ( p ) p M q M - 1 p q
Câu 2 : Câu hỏi của tôi là làm thế nào chúng ta có thể mong đợi tuân theo phân phối Gaussian? Trong thực tế có thể là bất kỳ phân phối phức tạp nào.π ( q )