Có N người chơi và M đối tượng, mỗi đối tượng có một giá trị. Mỗi người chơi có một chiến lược trong việc chọn một đối tượng. Mỗi vòng một người chơi sẽ chọn một đối tượng, nhiều người chơi có thể chọn cùng một đối tượng. Tuy nhiên, giá trị của từng đối tượng được chia đều cho mỗi người chơi đã chọn nó. Sẽ có 9000 vòng (lựa chọn) cho mỗi trò chơi. Mục tiêu của chúng tôi là tối đa hóa các giá trị mà chúng tôi tích lũy vào cuối trò chơi.
Câu hỏi: làm thế nào tôi có thể xây dựng hàm phân phối xác suất cho mỗi lần chơi giả định rằng các quyết định của họ là các biến ngẫu nhiên?
Cách tiếp cận hiện tại: Cách tiếp cận hiện tại của tôi là đếm tần suất người chơi chọn một đối tượng cụ thể và chia cho tổng số vòng, điều đó sẽ đưa ra xác suất người chơi có khả năng chọn đối tượng cụ thể đó.
Vấn đề: Với mỗi người chơi đang cố gắng hết sức để không thể đoán trước được (tiếng ồn), với cách tiếp cận hiện tại của tôi, các hàm phân phối xác suất không chính xác (9000 vòng dường như không đủ dữ liệu). Có cách nào tốt hơn để xây dựng các chức năng phân phối này không?
Lưu ý: Tôi đã đọc ở đâu đó rằng (mô hình Bayes và HMM) vượt trội hơn so với số lượng tần số, nhưng tôi không chắc làm thế nào để thích ứng với tình huống này.