Là lấy mẫu hypercube Latin có hiệu quả trong nhiều chiều?


8

Tôi hiện đang sử dụng Lấy mẫu Hypercube Latin (LHS) để tạo các số ngẫu nhiên thống nhất có khoảng cách đều nhau cho các quy trình Monte Carlo. Mặc dù việc giảm phương sai mà tôi có được từ LHS là tuyệt vời cho 1 chiều, nhưng dường như nó không hiệu quả ở 2 chiều trở lên. Xem LHS là một kỹ thuật giảm phương sai nổi tiếng như thế nào, tôi tự hỏi liệu tôi có thể hiểu sai thuật toán hoặc sử dụng sai nó theo một cách nào đó.

Cụ thể, thuật toán LHS mà tôi sử dụng để tạo cách nhau các biến ngẫu nhiên thống nhất trong các kích thước là:ND

  • Đối với mỗi thứ nguyên , hãy tạo một tập hợp số ngẫu nhiên được phân phối đồng đều sao cho , ...DN{bạnD1,bạnD2...bạnDN}bạnD1[0,1N+1]bạnD2[1N+1,2N+1]bạnDN[NN+1,1]

  • Đối với mỗi thứ nguyên , sắp xếp lại các phần tử từ mỗi bộ một cách ngẫu nhiên. đầu tiên do LHS tạo ra là vectơ có chứa phần tử đầu tiên từ mỗi tập hợp được sắp xếp lại, thứ hai do LHS tạo ra là vectơ chứa phần thứ hai phần tử từ mỗi bộ được sắp xếp lại, v.v ...D2Bạn(0,1)DDBạn(0,1)DD

Tôi đã bao gồm một số lô dưới đây để minh họa việc giảm phương sai tôi nhận được trong và cho thủ tục Monte Carlo. Trong trường hợp này, vấn đề liên quan đến việc ước tính giá trị dự kiến ​​của hàm chi phí trong đó và là biến ngẫu nhiên phân phối giữa . Cụ thể, các ô hiển thị giá trị trung bình và độ lệch chuẩn của 100 ước tính trung bình mẫu của cho các cỡ mẫu từ 1000 đến 10000.D= =1D= =2E[c(x)]c(x)= =φ(x)xD[-5,5]E[c(x)]

LHS với $ D = 1 $

LHS với giá $ D = 2 $

Tôi nhận được cùng loại kết quả giảm phương sai bất kể tôi sử dụng triển khai của riêng tôi hay lhsdesignhàm trong MATLAB. Ngoài ra, mức giảm phương sai không thay đổi nếu tôi hoán vị tất cả các bộ số ngẫu nhiên thay vì chỉ các bộ tương ứng với .D2

Các kết quả có ý nghĩa vì lấy mẫu phân tầng trong có nghĩa là chúng ta nên lấy mẫu từ bình phương thay vì bình phương được đảm bảo trải đều.D= =2N2N

Câu trả lời:


3

Tôi đã chia các vấn đề được mô tả trong bài viết của bạn thành ba câu hỏi dưới đây. Một tài liệu tham khảo tốt cho các kết quả về Lấy mẫu Hypercube Latin và các kỹ thuật giảm phương sai khác là chương sách này . Ngoài ra, chương sách này cung cấp thông tin về một số 'điều cơ bản' về giảm phương sai.

Q0. Giảm phương sai là gì? Trước khi đi vào chi tiết, thật hữu ích khi nhớ lại "giảm phương sai" thực sự có nghĩa là gì. Như đã giải thích trong chương sách 'cơ bản', phương sai lỗi liên quan đến thủ tục Monte Carlo thường có dạngσ2/ntheo mẫu IID. Để giảm phương sai lỗi, chúng ta có thể tăng cỡ mẫun hoặc tìm cách giảm σ. Giảm phương sai có liên quan đến các cách giảmσ, vì vậy các phương thức như vậy có thể không có bất kỳ ảnh hưởng nào đến cách thay đổi phương sai lỗi như n khác nhau

Q1. Latin Hypercube Sampling đã được thực hiện đúng chưa? Mô tả bằng văn bản của bạn có vẻ đúng với tôi và phù hợp với mô tả trong chương sách. Nhận xét duy nhất của tôi là phạm vi của bạnDTôicác biến dường như không điền vào toàn bộ khoảng thời gian đơn vị; có vẻ như bạn thực sự yêu cầubạnDTôi[Tôi-1N,TôiN], nhưng hy vọng lỗi này không ảnh hưởng đến việc triển khai của bạn. Dù sao, thực tế là cả hai triển khai đều cho kết quả tương tự sẽ cho thấy việc triển khai của bạn có khả năng đúng.

Quý 2 Kết quả của bạn có phù hợp với những gì bạn có thể mong đợi từ LHS không? Dự luật 10,4 trong chương sách nói rằng phương sai LHS không bao giờ có thể tệ hơn nhiều so với phương sai thu được từ lấy mẫu IID. Thông thường, phương sai LHS ít hơn nhiều so với phương sai IID. Chính xác hơn, Dự luật 10.1 nêu rõ, đối với ước tính LHSμ^LHS= =1nΣTôi= =1nf(XTôi), chúng ta có

Vmộtr(μ^LHS)= =n-1e(x)2dx+o(n-1)
Ở đâu e(x) là 'phần dư từ tính gây nghiện' của hàm f I E f trừ đi xấp xỉ phụ gia tốt nhất của nó (xem p.10 của chương sách để biết chi tiết, f là phụ gia nếu chúng ta có thể viết f(x)= =μ+Σj= =1Dfj(xj)).

Dành cho D= =1, mọi chức năng đều là phụ gia e= =0Vmộtr(μ^LHS)= =o(n-1)từ Dự luật 10.1. Trong thực tế, choD= =1 LHS tương đương với phân tầng dựa trên lưới (Phần 10.1 trong chương sách), vì vậy phương sai thực sự là Ôi(n-3) (phương trình 10.2 trong chương sách; giả sử fliên tục khác biệt). Điều này dường như không phù hợp với biểu đồ đầu tiên của bạn. Điểm chính làD= =1 là một trường hợp rất đặc biệt!

Dành cho D= =2, có khả năng là trường hợp đó e0 vì vậy bạn có thể mong đợi một phương sai của trật tự Ôi(n-1). Một lần nữa, điều này không phù hợp với biểu đồ thứ hai của bạn. Việc giảm phương sai thực tế đạt được (so với lấy mẫu IID) sẽ phụ thuộc vào mức độ đóng của chức năng bạn chọn là phụ gia.

Tóm lại, LHS có thể có hiệu quả ở các kích thước thấp đến trung bình và đặc biệt đối với các hàm được xấp xỉ bằng các hàm cộng.


2

http://statweb.stanford.edu/~owen/mc/Ch-var-adv.pdf

Bài viết này thảo luận về việc giảm phương sai của Lấy mẫu Hypercube Latin theo nhiều chiều. LHS không thực thi tính đồng nhất khi lấy mẫu theo nhiều chiều vì nó chỉ lấy mẫu theo từng chiều một cách độc lập và sau đó kết hợp các kích thước một cách ngẫu nhiên. Lấy mẫu phân tầng các thùng N 2 như bạn đề cập cũng được gọi là Lấy mẫu trực giao như được thảo luận trên trang Wikipedia: https://en.wikipedia.org/wiki/Latin_hypercube_sampling và hơn nữa thực thi tính đồng nhất đa chiều bằng cách lấy mẫu từ các thùng của thay vào đó, tất cả các kích thước kết hợp.

Với một vài điều chỉnh cho kiểu lấy mẫu này, phương sai lỗi có thể được hiển thị là O (N -1-2 / d ) (trong ref ở trên). Mặc dù điều này mang lại lợi ích lớn cho kích thước nhỏ, nhưng ở kích thước lớn hơn, nó bắt đầu giảm dần về hiệu suất của Monte Carlo thông thường.


1

Tôi muốn bình luận về "nghiện". LHS đảm bảo rằng X1 và X2 được phân phối tốt (thường là trong (0,1)), vì vậy nếu một thiết kế chỉ phụ thuộc vào một biến, bạn sẽ có được biểu đồ "hoàn hảo" và giảm phương sai mạnh. Để tích hợp f = 100 * X1 + X2, bạn cũng sẽ nhận được kết quả tốt, nhưng không phải cho X1-X2! Sự khác biệt này có phân phối ngẫu nhiên gần như iid, không có đặc điểm LHS. Trong thiết bị điện tử, các thiết kế thường khai thác rằng 2 ảnh hưởng tham số sẽ chủ yếu hủy từng cái (cặp vi sai, gương hiện tại, mạch bản sao, v.v.), nhưng hiệu ứng của X1-X2 không phù hợp vẫn còn tồn tại và thường chiếm ưu thế. Do đó, phân tích LHS MC hoạt động không tốt hơn MC rnd trong nhiều thiết kế điện.


Không chắc nó có nghĩa là gì f= =X1-X2để có một "phân phối ngẫu nhiên gần như iid, không có đặc điểm LHS". Trong trường hợp nàyf vẫn là phụ gia, do đó bạn có thể mong đợi giảm phương sai tốt bằng cách sử dụng LHS, giống như với hàm phụ gia f= =100X1+X2. Bạn có thể xác minh điều này bằng cách mô phỏng.
S. Catterall phục hồi lại
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.