Vũ trụ của OpenAI sử dụng thuật toán RL và tôi đã nghe nói về một số dự án đào tạo trò chơi bằng cách sử dụng Q learning, nhưng có bất kỳ dự án nào khác được sử dụng để làm chủ / chiến thắng trò chơi không? Các thuật toán di truyền có thể được sử dụng để giành chiến thắng trong một trò chơi?