Một trong những câu hỏi phổ biến hơn được hỏi trên trang web này liên quan đến triển vọng của một AI cờ vua hoàn toàn tự đào tạo.
Hôm nay, ChessBase bị phân tâm khỏi phạm vi bảo hiểm của giải đấu Ứng viên FIDE để báo cáo rằng lần đầu tiên AI mới đánh bại một bậc thầy hàng đầu của trò chơi cờ vây khác biệt, đã chống lại AI theo phong cách cờ vua trong nhiều năm. Một bài đọc ban đầu của báo cáo cho thấy AI đi mới không giống như AI của cờ vua, nhưng gần giống với AI chơi trò chơi nói chung (GGP). Tuy nhiên, bài viết của ChessBase không sử dụng thuật ngữ GGP, nhưng dường như nói rằng AI đi có thể giành chiến thắng tại các trò chơi video đơn giản.
Có bất kỳ lý do nào để chiến thắng như vậy AI không thể với những điều chỉnh nhỏ cũng giành chiến thắng tại cờ vua? Nếu vậy, một chương trình AI như vậy hứa hẹn sẽ đạt được sự tự đào tạo thuần túy, một số câu trả lời xuất sắc cho câu hỏi trước đó đã được thảo luận trước đó, điều mà vào thời điểm đó vẫn chưa thể thực hiện được? Tại sao hay tại sao không?
Tôi nghi ngờ rằng chưa có câu trả lời thực sự đầy đủ, đầy đủ thông tin cho câu hỏi của tôi, vì vậy ngay cả một câu trả lời một phần dựa trên chuyên môn liên quan cũng sẽ được đánh giá cao.
Để tham khảo thêm, xem thêm câu hỏi và câu trả lời liên quan này.
CẬP NHẬT
Khi câu hỏi trên được đăng lần đầu năm ngày trước và khi một số câu trả lời hay dưới đây được đưa ra, tin tức đầu tiên liên quan đến chiến thắng của AI đã xuất hiện. Kể từ đó, thông tin bổ sung và bình luận đã xuất hiện.
Đặc biệt thú vị kể từ đó là một cuộc thảo luận bàn tròn năm mặt khá dễ đọc, trong đó Jonathan Schaeffer nhận xét:
Học từ các trò chơi của con người giúp tăng tốc học tập của chương trình. AlphaGo có thể tự học để trở thành một người chơi mạnh mẽ mà không cần sử dụng các trò chơi của con người. Quá trình học tập sẽ chỉ mất nhiều thời gian hơn.
Theo chủ nhà của hội nghị bàn tròn, Schaeffer là "[c] giáo sư khoa học máy tính tại Đại học Alberta và là người đàn ông giải bài kiểm tra"; vì vậy, có lẽ, anh ta có thể đủ điều kiện để bình luận.
Để biết thêm thông tin, đây là hồ sơ của một cuộc thảo luận mở, nhiều người tham gia có vẻ thông tin tốt hơn bình thường. Cuộc thảo luận diễn ra trong trận đấu.
Cập nhật thêm, một năm rưỡi sau: bình luận viên @MarkS. viết:
Đây chỉ là một nhận xét vì đó là về cờ vây, không phải cờ vua, nhưng AlphaGo Zero đã đạt được "sự tự rèn luyện thuần túy" chỉ từ việc được nói ai là người chiến thắng (và không phải là điểm số cuối cùng) và mạnh hơn và hiệu quả hơn rất nhiều so với AI đánh bại Lee Sedol . Để biết thêm thông tin, hãy xem deepmind.com/blog/alphago-zero-learning-scratch