Tôi đang cố gắng tìm hiểu thuật toán nổi loạn của VEGAS ( ấn phẩm gốc ( bản in từ LKlevin) và ghi chú thực hiện ) tích hợp Monte Carlo. Tôi sẽ cố gắng giải thích trước những gì tôi nghĩ rằng tôi đã hiểu và sau đó đặt ra câu hỏi của mình.
Để đơn giản, giả sử chúng ta có hàm 1 chiều dương trên toàn bộ khoảng [ 0 , 1 ] . Khoảng này được phân tách thành, giả sử, n thùng. Những thùng này có kích thước ban đầu như nhau. Kích thước bin Δ x i xác định mật độ xác suất
Các kích thước bin phải thêm đến độ dài của khoảng thời gian để làm cho bình thường hóa đúng cách:
Sử dụng số được chọn ngẫu nhiên { x i } từ sự phân bố ρ ( x ) VEGAS tính xấp xỉ S ( 1 ) của tích phân:
Cho đến nay, đây chỉ là lấy mẫu quan trọng (tôi không quan tâm đến lấy mẫu phân tầng) bằng cách sử dụng lưới có kích thước thay đổi. Phần thú vị trong VEGAS là thuật toán rebinning, tức là thuật toán tính toán lại kích thước bin tùy thuộc vào các giá trị hàm được tích lũy trong lần lặp trước:
- Đối với mỗi thùng, các giá trị hàm bình phương (?) Được tính tổng (trong ấn phẩm gốc, các giá trị tuyệt đối được tổng hợp).
- Ngoài ra còn có một chức năng làm ẩm được áp dụng cho từng giá trị, để "tránh những thay đổi nhanh chóng, làm mất ổn định".
- Sau đó, mỗi giá trị được làm mịn bằng các thùng lân cận. Tôi đoán điều này cũng bổ sung một số tính ổn định cho thuật toán rebinning cho một số chức năng nhất định (nhưng tôi không thể giải thích tại sao). Hãy gọi các giá trị cuối cùng .
- Các kích thước thùng hiện được đặt sao cho mỗi thùng mới chứa xấp xỉ mức trung bình:
Thuật toán này làm cho các thùng phát triển trong đó hàm "nhỏ" và co lại trong đó hàm "lớn". Nhỏ và lớn được hiểu liên quan đến nhau, ví dụ: cực đại của hàm được coi là "lớn" và mọi thứ khác sẽ được coi là "nhỏ hơn". Vì xác suất để một điểm kết thúc trong bất kỳ thùng nào là bằng nhau (VEGAS được viết để thể hiện hành vi này), nên hàm được lấy mẫu nhiều nhất ở nơi lớn nhất và do đó lỗi được giảm.
Tại sao nó được viết theo cách đó? Tại sao người ta không giải quyết vấn đề trực tiếp hơn, ví dụ bằng cách lấy hàm trung bình và hàm số làm mật độ xác suất cho lần lặp tiếp theo?