Câu hỏi hay.
Đầu tiên và quan trọng nhất là trong Deepmind không có đối thủ siêu phàm nào để thách đấu. Động cơ cờ vây không ở bất cứ đâu gần mức cao nhất của những người chơi hàng đầu của con người. Tuy nhiên, trong cờ vua, các động cơ mạnh hơn 500 điểm ELO so với những người chơi hàng đầu của con người. Đây là một sự khác biệt lớn. Số lượng công việc đã đi vào động cơ cờ vua đương đại là đáng kinh ngạc. Chúng ta đang nói về hàng triệu giờ trong lập trình, hàng trăm ngàn lần lặp. Đó là một khối lượng lớn kiến thức và công việc. Để vượt qua và vượt qua tất cả trong 4 giờ là đáng kinh ngạc.
Thứ hai, đó không phải là kết quả đáng ngạc nhiên đối với các bậc thầy cờ vua mà thay vào đó là cách AlphaZero chơi cờ. Thật là mỉa mai khi một hệ thống không có kiến thức hay chuyên môn của con người đóng vai trò giống như chúng ta. Động cơ nổi tiếng là chơi những động tác xấu xí, thiếu hài hòa v.v ... Thật khó để giải thích với một người không chơi cờ nhưng có một thứ gọi là "Di chuyển nhân tạo" như những động cơ đương thời thường xuất hiện. AlphaZero hoàn toàn không chơi như thế này. Nó có một phong cách rất giống con người, nơi nó thống trị quân cờ của đối thủ với lối chơi chiến lược sâu sắc và sự hy sinh vị trí tuyệt đẹp. AlphaZero chơi theo cách chúng ta mong muốn, kết hợp sự hiểu biết vị trí sâu sắc với độ chính xác của một tính toán động cơ.
Chỉnh sửa
Oh và tôi quên đề cập đến một cái gì đó về kết quả. Nếu bạn không quen thuộc với cờ vua máy tính, nó có vẻ không đáng kinh ngạc nhưng nó là.
Ngày nay, lề của chiến thắng tách biệt các động cơ đương đại hàng đầu là mỏng như dao cạo. Trong một trận đấu 100 trò chơi, bạn có thể mong đợi thấy một kết quả như 85 trận được rút ra, 9 chiến thắng và 6 trận thua để xác định động cơ tốt hơn.
AlphaZero có 28 chiến thắng và 72 trận hòa mà không thua gì là sự nghiền nát của thế giới khác và hoàn toàn không thể tưởng tượng được cho đến thời điểm nó xảy ra.