Tôi đã có một triển khai cho một đại lý duy nhất làm việc về một vấn đề giá động với mục tiêu tối đa hóa doanh thu. Tuy nhiên, vấn đề mà tôi đang làm việc liên quan đến một số sản phẩm khác nhau thay thế cho nhau, do đó, việc định giá tất cả chúng với những người học độc lập dường như không chính xác, bởi vì giá của một sản phẩm này ảnh hưởng đến phần thưởng của sản phẩm kia. Mục tiêu sẽ là tự động định giá tất cả chúng để tối đa hóa tổng của từng doanh thu.
Tôi đã thực hiện một số nghiên cứu để cố gắng tìm ra thứ gì đó áp dụng việc học tăng cường theo cách này, nhưng nhiều triển khai đa tác nhân tôi đã thấy tập trung vào các trò chơi cạnh tranh hơn là hợp tác, hoặc họ cho rằng kiến thức không đầy đủ về các tác nhân khác (tôi sẽ hoàn thành kiến thức của từng tác nhân trong kịch bản này). Có bất kỳ ứng dụng được nghiên cứu / tài liệu tốt về học tập hợp tác theo cách này?