Sử dụng phương pháp lấy mẫu Biến đổi & Từ chối & Biến đổi nghịch đảo


7

Tôi biết rằng phương thức Biến đổi nghịch đảo không phải lúc nào cũng là một lựa chọn tốt để lấy mẫu từ các bản phân phối vì đây là phương pháp phân tích phụ thuộc vào hình dạng của hàm phân phối. Ví dụ, phân phối Gaussian một chiều nghịch đảo là không thể tính toán, tuy nhiên, việc lấy mẫu cho kết quả tốt. Tôi có thể nói rằng đối với tôi, phương pháp này là tất cả những gì tôi cần. Nhưng, liệu các phương thức MCMC ( Metropolis-Hastings hay Rejection ) có thể hoạt động tốt hơn Inverse Transform không? Các phương pháp MCMC có tốt hơn CNTT vì chúng bao gồm các sự kiện hiếm hơn không? Hoặc, có bất kỳ lợi thế khác? Một số ví dụ có thể giúp! Cảm ơn!


1
Điều này có lẽ nên được đóng lại cho đến khi nó được làm rõ hơn, nhưng có một số câu trả lời tốt, vì vậy tôi sẽ để mọi thứ nói dối ngay bây giờ. Có một số vấn đề, bao gồm ... 1. Có nhiều phương pháp lấy mẫu từ các bản phân phối bình thường - bao gồm nhiều biến thể về lấy mẫu từ chối. Vì vậy, lấy mẫu từ chối có thể tốt hơn & xấu hơn so với cách tiếp cận khác 2 Tốt hơn theo nghĩa nào? 3. Một số tiền đề không đúng. Cdf bình thường nghịch đảo có thể được tính toán (với bất kỳ mức độ chính xác cần thiết nào, thậm chí), nó chỉ không tồn tại ở dạng đóng. Chúng ta có thể tính toán nó theo cùng một nghĩa là chúng ta có thể tính toán một arcsin.
Glen_b -Reinstate Monica

Câu trả lời:


7

Hoàn toàn không đúng khi nói rằng các phương pháp nghịch đảo là không thể tính toán. Có các xấp xỉ số hoàn toàn tốt với CDF Gauss nghịch đảo . Theo như tôi biết, rất nhiều phương pháp sử dụng nó để tạo các biến ngẫu nhiên gaussian. Tất nhiên có rất nhiều phương pháp khác , có thể đơn giản hơn để tạo Gaussian.

Liên quan đến lấy mẫu từ chối, đây là một túi hỗn hợp. Nếu là pdf Gaussian, sau đó lấy mẫu từ chối, bạn cần phải tìm một PDF mà thống trị : , đối với một số . Một cách giải thích cho ở đây là số lần từ chối dự kiến ​​bạn cần thực hiện trước khi chấp nhận một mẫu, vì vậy càng nhỏ thì càng tốt. Vấn đề này có thể làm cho việc từ chối lấy mẫu là một nỗi đau rất lớn bởi vì đôi khi là rất lớn. Quy tắc ở đây là, nếu bạn không thể tìm thấy một làm cho có thể chuyển đổi được, bạn sẽ cần xem xét các phương thức khác, ví dụ: phương pháp biến đổi nghịch đảo.f(x)g(x) f(x)f(x)Mg(x)M>0MMMgM

Ví dụ: phân phối theo cấp số nhân hoạt động cho phân phối bình thường (thực tế là phân phối một mặt bình thường, sau đó bạn có thể lật một đồng xu để quyết định ký hiệu). Trong trường hợp này, bạn có thể tìm ra , điều này thật tuyệt vời vì hàm mũ rất dễ tạo ra bằng phương pháp cdf nghịch đảo và bạn chỉ cần ném ra khoảng 2 mẫu trung bình . Điều tuyệt vời khi lấy mẫu từ chối kết hợp với MCMC là, khi được sử dụng một cách thông minh , bạn có thể mô phỏng các sự kiện hiếm mà không thực sự phải đợi thời gian tồn tại của vũ trụ để sự kiện xảy ra.M=2π/e=1.32


1
Bạn có thể chính xác những gì bạn có ý nghĩa của các công việc theo cấp số nhân cho bình thường? Nói đúng ra điều này là không chính xác vì số mũ có hỗ trợ nhỏ hơn, . R+
Tây An

@ Xi'an: bản in đẹp: tạo phân phối Gaussian một nửa bằng cách sử dụng hàm mũ và sau đó lật một đồng xu để quyết định ký hiệu. Tôi cho rằng bạn cũng có thể sử dụng phân phối Lorenz trực tiếp
Alex R.

3

So sánh giữa các phương pháp mô phỏng chỉ là về hiệu quả vì tất cả chúng đều tạo ra một đầu ra được cho là từ cùng một phân phối mục tiêu. Do đó, bạn không thể mong đợi một phương pháp mô phỏng (như MCMC) sẽ tạo ra nhiều sự kiện hiếm hơn so với phương pháp khác, vì những sự kiện hiếm gặp đó được cho là xảy ra ở tỷ lệ chính xác (và hiếm).

Điều ngược lại CDF đổi cách tiếp cận, cụ thể là để trở khi là , như phân phối từ . là đúng về mặt toán học. Nó có thể trở nên không hiệu quả khi tính toánF(U)UU(0,1)FF1là quá khắt khe. Nếu phần mềm bạn chọn bao gồm mã cho nghịch đảo này, thì không cần phải tìm kiếm thêm, trừ khi bạn lo lắng về độ chính xác của nghịch đảo (nhưng sau đó cần tìm một phương pháp khác với độ chính xác bằng số cao hơn!). Nếu cdf nghịch đảo không được mã hóa và đòi hỏi đầu tư mã hóa lớn, sẽ hiệu quả hơn khi tìm kiếm các phương pháp chung như phương pháp Monte Carlo chuỗi Markov, vốn bị nhược điểm là không đảm bảo mô phỏng chính xác từ mục tiêu. Đây là các phương pháp tiệm cận trong đó phân phối mô phỏng chỉ hội tụ đến phân phối đích khi số bước Markov tăng lên vô hạn (trừ trường hợp đặc biệt có thể xác thực hội tụ sau một số bước hữu hạn). Nhưng đây cũng là chung chung các phương thức đòi hỏi ít mã hóa và lập kế hoạch hơn, do đó các phương thức hiệu quả hơn theo nghĩa là thời gian máy tính khá rẻ, khi so sánh với thời gian của chính người viết mã.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.