Đây là hai tài liệu khảo sát tôi đã tìm thấy gần đây. Tôi chưa đọc chúng, nhưng tóm tắt nghe có vẻ hứa hẹn.
Joann `Vermorel và Mehryar Mohri: Thuật toán cướp đa vũ trang và đánh giá thực nghiệm (2005)
Từ tóm tắt:
Vấn đề tên cướp đa vũ trang cho một con bạc là quyết định cánh tay nào của máy đánh bạc K sẽ kéo để tối đa hóa phần thưởng của anh ta trong một loạt các thử nghiệm. Nhiều vấn đề học tập và tối ưu hóa trong thế giới thực có thể được mô hình hóa theo cách này. Một số chiến lược hoặc thuật toán đã được đề xuất như một giải pháp cho vấn đề này trong hai thập kỷ qua, nhưng, theo hiểu biết của chúng tôi, không có đánh giá chung về các thuật toán này.
Volodymyr Kuleshov và Doina Precup: Thuật toán cho vấn đề tên cướp đa vũ trang (2000) Từ bản tóm tắt:
Thứ hai, hiệu suất của hầu hết các thuật toán thay đổi đáng kể với các tham số của vấn đề tên cướp. Nghiên cứu của chúng tôi xác định cho mỗi thuật toán các cài đặt nơi nó hoạt động tốt và các cài đặt nơi nó thực hiện kém.