Ai đó có thể giải thích cho tôi NUTS bằng tiếng Anh?


17

Sự hiểu biết của tôi về thuật toán là như sau:

Không có Sam-Turn Sampler (NUTS) là Phương pháp Hamilton Carlo. Điều này có nghĩa là nó không phải là một phương pháp Chuỗi Markov và do đó, thuật toán này tránh được phần đi bộ ngẫu nhiên, thường được coi là không hiệu quả và chậm hội tụ.

Thay vì thực hiện bước đi ngẫu nhiên, NUTS thực hiện bước nhảy có độ dài x. Mỗi bước nhảy tăng gấp đôi khi thuật toán tiếp tục chạy. Điều này xảy ra cho đến khi quỹ đạo đạt đến điểm mà nó muốn quay trở lại điểm xuất phát.

Câu hỏi của tôi: Điều gì đặc biệt về ngã rẽ? Làm thế nào để nhân đôi quỹ đạo không bỏ qua điểm tối ưu hóa? Là mô tả trên của tôi là chính xác?


Tôi tìm thấy bài đăng này và các mô phỏng minh họa thực sự tạo ra sự khác biệt trong việc giải thích các khái niệm.
kael

Câu trả lời:


13

Bit không quay đầu là cách các đề xuất được tạo. HMC tạo ra một hệ thống vật lý giả thuyết: tưởng tượng một quả bóng có động năng nhất định lăn quanh một cảnh quan với các thung lũng và đồi (sự tương tự bị phá vỡ với hơn 2 chiều) được xác định bởi hậu thế mà bạn muốn lấy mẫu. Mỗi khi bạn muốn lấy một mẫu MCMC mới, bạn chọn ngẫu nhiên động năng và bắt đầu quả bóng lăn từ nơi bạn đang đứng. Bạn mô phỏng theo các bước thời gian riêng biệt và để đảm bảo bạn khám phá không gian tham số đúng cách, bạn mô phỏng các bước theo một hướng và gấp đôi số lần theo hướng khác, quay lại lần nữa, v.v. Tại một số điểm bạn muốn dừng việc này và một cách tốt thực hiện điều đó là khi bạn đã thực hiện quay đầu xe (tức là dường như đã đi khắp nơi).

Tại thời điểm này, bước tiếp theo được đề xuất của Chuỗi Markov của bạn sẽ được chọn (với một số hạn chế nhất định) từ các điểm bạn đã truy cập. Tức là toàn bộ mô phỏng của hệ thống vật lý giả định là "chỉ" để nhận được đề xuất sau đó được chấp nhận (mẫu MCMC tiếp theo là điểm được đề xuất) hoặc bị từ chối (mẫu MCMC tiếp theo là điểm bắt đầu).

Điều thông minh về nó là các đề xuất được thực hiện dựa trên hình dạng của hậu thế và có thể ở đầu kia của bản phân phối. Ngược lại, Metropolis-Hastings đưa ra các đề xuất trong một quả bóng (có thể bị lệch), lấy mẫu Gibbs chỉ di chuyển dọc theo một (hoặc ít nhất là rất ít) tại một thời điểm.


Bạn có thể mở rộng trên bình luận " dường như đã đi khắp nơi " không?
Gabriel

1
Có nghĩa là có một số dấu hiệu cho thấy nó đã bao trùm phân phối, mà NUTS cố gắng đánh giá xem bạn có hoàn toàn quay đầu lại không. Nếu đó là trường hợp, bạn hy vọng có thể trong một bước MCMC đi đến bất kỳ phần nào của hậu thế. Tất nhiên, điều kiện không thực sự đảm bảo rằng bạn đã khám phá toàn bộ hậu thế, nhưng đưa ra một dấu hiệu cho thấy bạn đã khám phá "phần hiện tại" của nó (nếu bạn có một số phân phối đa phương thức, bạn có thể gặp khó khăn để đi đến tất cả các phần của phân phối).
Bjorn

6

Bạn không chính xác rằng HMC không phải là phương pháp Chuỗi Markov. Theo Wikipedia :

Trong toán học và vật lý, thuật toán lai Monte Carlo, còn được gọi là Hamiltonian Monte Carlo, là một phương pháp Monte Carlo chuỗi Markov để thu được một chuỗi các mẫu ngẫu nhiên từ phân phối xác suất mà việc lấy mẫu trực tiếp rất khó khăn. Trình tự này có thể được sử dụng để xấp xỉ phân phối (nghĩa là để tạo biểu đồ) hoặc để tính tích phân (chẳng hạn như giá trị mong đợi).

Để rõ ràng hơn, hãy đọc bài viết arXiv của Betancourt , trong đó đề cập đến tiêu chí chấm dứt NUTS:

... xác định khi một quỹ đạo đủ dài để mang lại sự thăm dò đủ về vùng lân cận xung quanh mức năng lượng hiện tại. Cụ thể, chúng tôi muốn tránh cả hai tích hợp quá ngắn, trong trường hợp đó chúng tôi sẽ không tận dụng hết các quỹ đạo của Hamilton và tích hợp quá lâu, trong trường hợp đó, chúng tôi lãng phí tài nguyên tính toán quý giá vào thăm dò mà chỉ mang lại lợi nhuận giảm dần.

Phụ lục A.3 nói về một cái gì đó giống như quỹ đạo nhân đôi mà bạn đề cập:

Chúng ta cũng có thể mở rộng nhanh hơn bằng cách nhân đôi chiều dài của quỹ đạo ở mỗi lần lặp, mang lại một quỹ đạo được lấy mẫu t ∼ T (t | z) = U T2L với trạng thái được lấy mẫu tương ứng z ′ T (z ′ | t). Trong trường hợp này, cả hai thành phần quỹ đạo cũ và mới ở mỗi lần lặp đều tương đương với các lá của cây nhị phân hoàn hảo, có trật tự (Hình 37). Điều này cho phép chúng tôi xây dựng các thành phần quỹ đạo mới theo cách đệ quy, truyền một mẫu ở mỗi bước trong đệ quy ...

và mở rộng về điều này trong A.4, trong đó nó nói về một triển khai động (phần A.3 nói về một triển khai tĩnh):

May mắn thay, các sơ đồ tĩnh hiệu quả được thảo luận trong Phần A.3 có thể được lặp đi lặp lại để đạt được triển khai động khi chúng ta đã chọn một tiêu chí để xác định khi quỹ đạo đã phát triển đủ lâu để khám phá mức năng lượng tương ứng.

Tôi nghĩ điều quan trọng là nó không nhảy gấp đôi, nó tính toán bước nhảy tiếp theo của mình bằng cách sử dụng một kỹ thuật nhân đôi độ dài của bước nhảy được đề xuất cho đến khi đạt được tiêu chí. Ít nhất đó là cách tôi hiểu bài báo cho đến nay.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.