Tôi không thể hiểu mục đích của trọng số lấy mẫu quan trọng (IS) trong Phát lại ưu tiên (trang 5) .
Một quá trình chuyển đổi có nhiều khả năng được lấy mẫu từ kinh nghiệm phát lại "chi phí" lớn hơn của nó. Sự hiểu biết của tôi là 'IS' giúp từ bỏ việc sử dụng phát lại ưu tiên sau khi chúng tôi được đào tạo đủ lâu. Nhưng những gì chúng ta sử dụng thay thế, lấy mẫu thống nhất?
Tôi đoán tôi không thể nhận ra mỗi thành phần trong một hệ số như vậy ảnh hưởng đến kết quả như thế nào . Ai đó có thể giải thích nó bằng lời?
Sau đó, nó được sử dụng để làm giảm độ dốc mà chúng ta cố gắng lấy từ các hiệu ứng chuyển tiếp.
Ở đâu:
- là "IS"
- N là kích thước của bộ đệm Trải nghiệm Phát lại
- P (i) là cơ hội để chọn chuyển đổi , tùy thuộc vào "chi phí của nó là bao nhiêu".
- bắt đầu từ 0 và được kéo ngày càng gần hơn với 1 với mỗi kỷ nguyên mới.
Là sự hiểu biết của tôi về các thông số này cũng đúng?
Chỉnh sửa Một lúc nào đó sau khi câu trả lời được chấp nhận, tôi đã tìm thấy một nguồn bổ sung, một video có thể hữu ích cho người mới bắt đầu - Mô phỏng MC: 3.5 Lấy mẫu quan trọng
Chỉnh sửa Như @avejidah đã nói trong phần bình luận cho câu trả lời của mình " được sử dụng để lấy trung bình các mẫu theo xác suất chúng sẽ được lấy mẫu" .
Để nhận ra lý do tại sao nó quan trọng, giả sử được sửa thành 1, chúng tôi có 4 mẫu, mỗi mẫu có như sau:P ( i )
0.1 0.2 0.3 0.4
Đó là, mục đầu tiên có 10% được chọn, thứ hai là 20%, v.v ... Bây giờ, đảo ngược chúng, chúng ta nhận được:
10 5 3.333 2.5
Tính trung bình thông qua (trong trường hợp của chúng tôi là ), chúng tôi nhận được:
2.5 1.25 0.8325 0.625 ...which would add up to '5.21'
Như chúng ta có thể thấy chúng gần với số 0 hơn các phiên bản đảo ngược đơn giản ( ). Điều này có nghĩa là độ dốc cho mạng của chúng tôi sẽ không được phóng to hết mức, dẫn đến phương sai ít hơn rất nhiều khi chúng tôi đào tạo mạng của mình.
Vì vậy, nếu không có này, chúng tôi đã may mắn chọn được mẫu ít có khả năng nhất ( ), độ dốc sẽ được chia tỷ lệ 10 lần. Nó thậm chí còn tồi tệ hơn với các giá trị nhỏ hơn, giả sử cơ hội , nếu phát lại kinh nghiệm của chúng tôi có nhiều ngàn mục, điều này là khá bình thường.