Làm thế nào mạnh mẽ là cỗ máy đánh bại nhà vô địch người chơi poker gần đây?
Làm thế nào mạnh mẽ là cỗ máy đánh bại nhà vô địch người chơi poker gần đây?
Câu trả lời:
Từ giấy Deep Stack :
Điều này dường như là để đào tạo:
Đối với mạng lần lượt, mười triệu tình huống quay bài xì phé (từ sau khi thẻ lần lượt được xử lý) đã được tạo và giải quyết với 6.144 lõi CPU của cụm nghiên cứu Tính toán MP2, sử dụng hơn 175 năm thời gian tính toán. Đối với mạng flop, một triệu tình huống flop poker (từ sau khi các thẻ flop được xử lý) đã được tạo và giải quyết. Những tình huống này đã được giải quyết bằng cách sử dụng bộ giải giới hạn độ sâu của DeepStack với mạng lần lượt được sử dụng cho các giá trị chính xác tại các trạng thái công khai ngay sau thẻ lần lượt. Chúng tôi đã sử dụng một cụm gồm 20 GPUS và một nửa thời gian tính toán của GPU. Đối với mạng phụ trợ, mười triệu tình huống đã được tạo và các giá trị đích đã đạt được bằng cách liệt kê tất cả 22.100 flops có thể và lấy trung bình các giá trị phản tác dụng từ đầu ra của mạng flop.
Và điều này để chơi thực tế:
Cả hai tính toán giải quyết lại và đánh giá mạng thần kinh đều được triển khai trong Torch7 (53) và chạy trên một card đồ họa NVIDIA GeForce GTX 1080 duy nhất.
Để so sánh: Phiên bản phân phối của AlphaGo đã lấy 1.920 CPU và 280 GPU để chạy.