Tôi đang làm việc với một vấn đề tên cướp đa vũ trang nơi chúng tôi không có bất kỳ thông tin nào về việc phân phối phần thưởng.
Tôi đã tìm thấy nhiều bài báo đảm bảo giới hạn hối tiếc cho một bản phân phối có ràng buộc đã biết và cho các bản phân phối chung có hỗ trợ trong [0,1].
Tôi muốn tìm hiểu xem có cách nào để thực hiện tốt trong môi trường mà việc phân phối phần thưởng không có bất kỳ đảm bảo nào về sự hỗ trợ của nó hay không. Tôi đang cố gắng tính giới hạn dung sai không tham số và sử dụng số đó để mở rộng phân phối phần thưởng để tôi có thể sử dụng thuật toán 2 được chỉ định trên bài viết này ( http://jmlr.org/proceedings/ con / v23 / agalal12 / agalal12.pdf ). Có ai nghĩ rằng phương pháp này sẽ làm việc?
Nếu không, bất cứ ai có thể chỉ cho tôi đến đúng chỗ?
Cảm ơn nhiều!