Tôi đang tự hỏi làm thế nào để đào tạo một mạng lưới thần kinh cho một trò chơi cờ tròn như, tic-tac-toe, cờ vua, rủi ro hoặc bất kỳ trò chơi dựa trên vòng nào khác. Việc di chuyển tiếp theo bằng suy luận dường như khá dễ dàng, bằng cách cung cấp trạng thái trò chơi làm đầu vào và sử dụng đầu ra làm động thái cho người chơi hiện tại. Tuy nhiên, việc đào tạo một AI cho mục đích đó dường như không đơn giản như vậy, bởi vì:
- Có thể không có đánh giá nếu một động tác duy nhất là tốt hay không, do đó, đào tạo các động tác đơn lẻ dường như không phải là lựa chọn đúng đắn
- Sử dụng tất cả các trạng thái trò chơi (đầu vào) và di chuyển (đầu ra) của toàn bộ trò chơi để huấn luyện mạng thần kinh, dường như không phải là lựa chọn đúng đắn vì không phải tất cả các di chuyển trong một trò chơi bị mất có thể xấu
Vì vậy, tôi tự hỏi làm thế nào để đào tạo một mạng lưới thần kinh cho một trò chơi bảng dựa trên vòng? Tôi muốn tạo một mạng lưới thần kinh cho tic-tac-toe bằng cách sử dụng tenorflow.