Tôi đang cố gắng học tăng cường học tập và chủ đề này thực sự khó hiểu với tôi. Tôi đã giới thiệu về thống kê, nhưng tôi không thể hiểu chủ đề này bằng trực giác.
Tôi đang cố gắng học tăng cường học tập và chủ đề này thực sự khó hiểu với tôi. Tôi đã giới thiệu về thống kê, nhưng tôi không thể hiểu chủ đề này bằng trực giác.
Câu trả lời:
Lấy mẫu quan trọng là một hình thức lấy mẫu từ một phân phối khác với phân phối lợi ích để dễ dàng có được các ước tính tốt hơn về một tham số từ phân phối lợi ích. Thông thường, điều này sẽ cung cấp các ước tính của tham số có phương sai thấp hơn mức có thể thu được bằng cách lấy mẫu trực tiếp từ phân phối ban đầu với cùng cỡ mẫu.
Nó được áp dụng trong các bối cảnh khác nhau. Trong lấy mẫu chung từ phân phối khác nhau cho phép lấy nhiều mẫu hơn trong một phần phân phối lợi ích được quyết định bởi ứng dụng (khu vực quan trọng).
Một ví dụ có thể là bạn muốn có một mẫu bao gồm nhiều mẫu từ đuôi phân phối hơn là lấy mẫu ngẫu nhiên thuần túy từ phân phối quan tâm sẽ cung cấp.
Các bài viết wikipedia mà tôi đã thấy về chủ đề này là quá trừu tượng. Nó là tốt hơn để xem xét các ví dụ cụ thể khác nhau. Tuy nhiên, nó bao gồm các liên kết đến các ứng dụng thú vị như Bayesian Networks.
Một ví dụ về lấy mẫu quan trọng trong những năm 1940 và 1950 là kỹ thuật giảm phương sai (một dạng của Phương pháp Monte Carlo). Xem ví dụ cuốn sách Phương pháp Monte Carlo của Hammersley và Handscomb được xuất bản dưới dạng Sách chuyên khảo Methuen / Chapman và Hội trường năm 1964 và được tái bản vào năm 1966 và sau đó bởi các nhà xuất bản khác. Mục 5.4 của cuốn sách bao gồm Lấy mẫu Tầm quan trọng.
Lấy mẫu quan trọng là một phương pháp mô phỏng hoặc Monte Carlo nhằm mục đích xấp xỉ các tích phân. Thuật ngữ "lấy mẫu" hơi khó hiểu ở chỗ nó không có ý định cung cấp các mẫu từ một phân phối nhất định.
Trực giác đằng sau việc lấy mẫu quan trọng là một tích phân được xác định rõ, như có thể được biểu thị như một kỳ vọng cho một phạm vi rộng phân phối xác suất: trong đó biểu thị mật độ của một phân phối xác suất và được xác định bởi và . (Lưu ý rằng thường khác với .) Thật vậy, lựa chọn dẫn đến các đẳng thức vàI = E f [ H ( X ) ] = ∫ X H ( x ) f ( x )
Khi đã hiểu được tính chất cơ bản này, việc thực hiện ý tưởng là dựa vào Định luật số lớn như trong các phương pháp khác của Monte Carlo, tức là mô phỏng [thông qua một trình tạo giả ngẫu nhiên] một mẫu iid phân phối từ và sử dụng xấp xỉ màf Tôi = 1
Tùy thuộc vào lựa chọn phân phối , công cụ ước tính ở trên có thể có hoặc không có phương sai hữu hạn. Tuy nhiên, luôn tồn tại các lựa chọn cho phép phương sai hữu hạn và thậm chí cho phương sai nhỏ tùy ý (mặc dù các lựa chọn đó có thể không có sẵn trong thực tế). Và cũng tồn tại các lựa chọn của làm cho công cụ ước tính lấy mẫu quan trọng một xấp xỉ rất kém của . Điều này bao gồm tất cả các lựa chọn trong đó phương sai là vô hạn, mặc dù một bài báo gần đây của Chatterjee và Diaconis nghiên cứu cách so sánh các bộ lấy mẫu quan trọng với phương sai vô hạn. Hình dưới đây được lấy từTôi f f Tôi Tôiblog của tôi thảo luận về bài báo và minh họa sự hội tụ kém của các công cụ ước tính phương sai vô hạn.
Lấy mẫu quan trọng với phân phối quan trọng phân phối mục tiêu phân phối Exp (1) phân phối Exp (1/10) và chức năng quan tâm . Giá trị thực của tích phân là .10
[Sau đây được sao chép từ cuốn sách Phương pháp thống kê Monte Carlo của chúng tôi .]
Ví dụ sau từ Ripley (1987) cho thấy lý do tại sao nó thực sự có thể trả tiền để tạo từ một phân phối khác với phân phối (bản gốc) xuất hiện trong tích phân quan tâm hoặc, nói cách khác, để sửa đổi biểu diễn của tích phân dưới dạng kỳ vọng đối với mật độ đã cho.∫ X h ( x ) f ( x )
Ví dụ (xác suất đuôi Cauchy) Giả sử rằng số tiền lãi là xác suất, , rằng biến Cauchy lớn hơn , nghĩa là, Khi được đánh giá thông qua trung bình theo kinh nghiệm của mẫu iid , phương sai của công cụ ước tính này là (bằng kể từ ).C ( 0 , 1 ) 2 p = ∫ + ∞ 2p p 1 = 1
Phương sai này có thể được giảm bằng cách tính đến tính chất đối xứng của , vì trung bình có phương sai bằng .
Sự không hiệu quả (tương đối) của các phương pháp này là do việc tạo ra các giá trị bên ngoài miền quan tâm, , theo một cách nào đó, không liên quan đến việc xấp xỉ . [Điều này liên quan đến ước tính khu vực đuôi của Michael Chernick.] Nếu được viết là tích phân ở trên có thể được coi là kỳ vọng của , trong đó . Do đó, một phương pháp đánh giá khác cho là cho
So với , việc giảm phương sai do mang lại theo thứ tự , đặc biệt, ngụ ý rằng việc đánh giá này yêu cầu Mô phỏng ít hơn lần so với để đạt được độ chính xác tương tự.