Đã có những nghiên cứu quy mô lớn về các phương pháp MCMC so sánh hiệu suất của một số thuật toán khác nhau trên một bộ mật độ thử nghiệm? Tôi đang nghĩ về một cái gì đó tương đương với bài báo của Rios và Sahinidis (2013), đó là một so sánh kỹ lưỡng về một số lượng lớn các trình tối ưu hóa hộp đen không dẫn xuất trên một số loại chức năng kiểm tra.
Đối với MCMC, hiệu suất có thể được ước tính, ví dụ: số lượng mẫu hiệu quả (ESS) trên mỗi đánh giá mật độ hoặc một số số liệu thích hợp khác.
Một vài bình luận:
Tôi đánh giá cao hiệu suất đó sẽ phụ thuộc mạnh mẽ vào chi tiết của pdf mục tiêu, nhưng một đối số tương tự (có thể không giống nhau) giữ tối ưu hóa, và dù sao cũng có rất nhiều chức năng điểm chuẩn, bộ, cuộc thi, bài báo, v.v ... liên quan đến tối ưu hóa điểm chuẩn thuật toán.
Ngoài ra, sự thật là MCMC khác với tối ưu hóa ở chỗ so sánh đó cần sự chăm sóc và điều chỉnh nhiều hơn từ người dùng. Tuy nhiên, hiện nay có một số phương pháp MCMC yêu cầu ít hoặc không cần điều chỉnh: các phương thức thích ứng trong pha burn-in, trong khi lấy mẫu hoặc các phương thức đa trạng thái (còn gọi là hòa tấu ) (như Emcee ) phát triển nhiều chuỗi tương tác và sử dụng thông tin từ các chuỗi khác để hướng dẫn lấy mẫu.
Tôi đặc biệt quan tâm đến việc so sánh giữa các phương pháp tiêu chuẩn và đa trạng thái (hay còn gọi là hòa tấu). Để biết định nghĩa về đa trạng thái, xem Phần 30.6 của cuốn sách MacKay :
- Câu hỏi này bắt nguồn từ đây .
Cập nhật
- Để có một trải nghiệm thú vị về các phương pháp tập hợp đa trạng thái, hãy xem bài đăng trên blog này của Bob Carpenter trên blog của Gelman và nhận xét của tôi đề cập đến bài đăng CV này.