Tôi học tốt nhất thông qua thử nghiệm và ví dụ. Tôi đang tìm hiểu về mạng lưới thần kinh và có (những gì tôi nghĩ) là một sự hiểu biết khá tốt về phân loại và hồi quy và cũng có sự giám sát và học tập không giám sát, nhưng tôi đã vấp phải điều gì đó mà tôi không thể im lặng tìm ra;
Nếu tôi muốn đào tạo một AI để chơi một trò chơi phức tạp; Tôi đang suy nghĩ điều gì đó giống như RTS (ví dụ: Age of Empires, Empire Earth, v.v.). Trong các loại trò chơi này thường có một số thực thể được điều khiển bởi người chơi (đơn vị, tòa nhà) mỗi loại có khả năng khác nhau. Có vẻ như vấn đề của AI là phân loại (ví dụ: chọn đơn vị đó và hành động đó), tuy nhiên vì số lượng đơn vị là một biến nên người ta xử lý vấn đề phân loại theo cách này như thế nào?
Điều duy nhất tôi có thể nghĩ đến là nhiều mạng thực hiện các giai đoạn khác nhau (một cho chiến lược tổng thể, một cho việc kiểm soát loại đơn vị này, một cho loại công trình đó, v.v.); nhưng điều này có vẻ như tôi đang làm cho vấn đề trở nên phức tạp.
Có ví dụ nào hay về máy học / mạng nơ-ron học các trò chơi phức tạp (không cụ thể là RTS, nhưng Mario phức tạp hơn )?