Tại sao các chuyên gia cờ vua ngạc nhiên trước chiến thắng của AlphaZero trước Stockfish?


10

Nó được thời gian gần đây đã mang đến sự chú ý của tôi mà các chuyên gia cờ vua mất kết quả của trận đấu bây giờ nổi tiếng này như một cái gì đó của một buồn bã.

Xem: Người chơi mới tốt nhất của Chess là một thuật toán không sợ hãi

Là một người không phải là chuyên gia về Cờ vua và Cờ vua AI, giả định của tôi là, dựa trên hiệu suất của AlphaGo và xác thực loại phương pháp đó liên quan đến các trò chơi kết hợp, là AI cũ hơn sẽ không có cơ hội.

  • Tại sao chiến thắng của AlphaZero lại gây ngạc nhiên?

Câu trả lời:


14

Câu hỏi hay.

Đầu tiên và quan trọng nhất là trong Deepmind không có đối thủ siêu phàm nào để thách đấu. Động cơ cờ vây không ở bất cứ đâu gần mức cao nhất của những người chơi hàng đầu của con người. Tuy nhiên, trong cờ vua, các động cơ mạnh hơn 500 điểm ELO so với những người chơi hàng đầu của con người. Đây là một sự khác biệt lớn. Số lượng công việc đã đi vào động cơ cờ vua đương đại là đáng kinh ngạc. Chúng ta đang nói về hàng triệu giờ trong lập trình, hàng trăm ngàn lần lặp. Đó là một khối lượng lớn kiến ​​thức và công việc. Để vượt qua và vượt qua tất cả trong 4 giờ là đáng kinh ngạc.

Thứ hai, đó không phải là kết quả đáng ngạc nhiên đối với các bậc thầy cờ vua mà thay vào đó là cách AlphaZero chơi cờ. Thật là mỉa mai khi một hệ thống không có kiến ​​thức hay chuyên môn của con người đóng vai trò giống như chúng ta. Động cơ nổi tiếng là chơi những động tác xấu xí, thiếu hài hòa v.v ... Thật khó để giải thích với một người không chơi cờ nhưng có một thứ gọi là "Di chuyển nhân tạo" như những động cơ đương thời thường xuất hiện. AlphaZero hoàn toàn không chơi như thế này. Nó có một phong cách rất giống con người, nơi nó thống trị quân cờ của đối thủ với lối chơi chiến lược sâu sắc và sự hy sinh vị trí tuyệt đẹp. AlphaZero chơi theo cách chúng ta mong muốn, kết hợp sự hiểu biết vị trí sâu sắc với độ chính xác của một tính toán động cơ.

Chỉnh sửa Oh và tôi quên đề cập đến một cái gì đó về kết quả. Nếu bạn không quen thuộc với cờ vua máy tính, nó có vẻ không đáng kinh ngạc nhưng nó là.

Ngày nay, lề của chiến thắng tách biệt các động cơ đương đại hàng đầu là mỏng như dao cạo. Trong một trận đấu 100 trò chơi, bạn có thể mong đợi thấy một kết quả như 85 trận được rút ra, 9 chiến thắng và 6 trận thua để xác định động cơ tốt hơn.

AlphaZero có 28 chiến thắng và 72 trận hòa mà không thua gì là sự nghiền nát của thế giới khác và hoàn toàn không thể tưởng tượng được cho đến thời điểm nó xảy ra.


Câu trả lời tốt đẹp. Quan điểm của bạn về việc so sánh giữa Cờ vua của AI rất thú vị về mặt giới hạn dựa trên tính vòng lặp của Cờ vua và bộ ba thắng / thua / hòa. (Có thể, trong tương lai, chúng ta sẽ cần các trò chơi hữu hạn, có thể điều khiển cho phép phân tích chi tiết hơn về mặt kết quả.) Tôi quen thuộc với lịch sử của các công cụ Cờ vua, và số lượng lớn nỗ lực và kiến ​​thức của con người đã đi vào chúng, nhưng bối cảnh của sự thiếu thành công lại: 19x19 Go phức tạp hơn nhiều đối với tôi.
DukeZhou

Cụ thể, giả định của tôi là nếu AlphaGo có thể đánh bại những người hàng đầu trong trò chơi phức tạp hơn đáng kể, thì có vẻ hợp lý rằng nó sẽ đánh bại không chỉ những người hàng đầu, mà cả những AI hàng đầu trước đó trong bất kỳ trò chơi nào khác.
DukeZhou

Một chút về các động tác nhân tạo là khá quan trọng, và không phải là điều mà tôi đã thấy những người không chơi cờ nói về. +1
Stella Biderman

4

MCTS cho cờ vua đã được thử trong văn học với rất ít thành công. Người ta cho rằng phương pháp của AlphaGo sẽ không bao giờ hoạt động trên cờ vua, có thể là trong cờ vây nhưng không phải trong cờ vua. Đột nhiên, Google tuyên bố cách tiếp cận đang hoạt động và nó đang đánh bại chương trình cờ vua mạnh nhất thế giới bằng một tỷ lệ rất cao.

Trước Google, tất cả các lập trình viên cờ vua đều được dạy chế tạo heuristic trong lập trình động cơ là một chiến lược tốt hơn so với học máy. Cho dù bạn đã triển khai mạng thần kinh như thế nào, nó sẽ không bao giờ chạy nhanh hơn một loạt các hướng dẫn về bảng bit 64 bit. AlphaGo chạy khá chậm , nhưng nó chơi cờ mạnh nhất.


2

Tôi thấy, dựa trên các bài báo bạn cung cấp, nhiều cấp độ bất ngờ trong chiến thắng:

Cờ vua là trò chơi khó để thành thạo và phần đối kháng có các hoạt động tốt nhất thế giới, AlphaZero có tabula rasa.

Việc học mất bốn giờ và AlphaZero không thua trận nào 100.

Phong cách chơi là một sự pha trộn xa lạ giữa con người và máy tính như di chuyển, hung hăng và đôi khi có vẻ ngớ ngẩn với những hy sinh không có ý tưởng nhưng thực sự làm cho tình trạng trong tương lai mạnh mẽ hơn.

Số lượng khả năng được tính trong mỗi lần di chuyển ít hơn so với phần đối trọng, AlphaZero có cảm giác hay trực giác bí ẩn.

Cảm giác buồn bã đến từ số lượng tài liệu đào tạo mà AlphaZero đã tự xây dựng và giới hạn thời gian, điều đó có thể không mang lại cho máy thời gian truyền thống.


Aaah. Vì vậy, nó bắt nguồn từ sự thiếu tự tin trong phương pháp AI mới. Điều đó có ý nghĩa.
DukeZhou
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.