BIÊN TẬP
@ unutbu's link trong bình luận là một bài giới thiệu tốt.
Sự hiểu biết vững chắc cho AlphaZero rất có thể đòi hỏi một mức độ định lượng (Tiến sĩ?). Bạn đang yêu cầu một khóa học sụp đổ trong AlphaZero?
Xin lưu ý trừ khi bạn đầu tư một lượng đáng kể thời gian của bạn, không có gì tôi nói sẽ làm việc. Không có cuốn sách nào có thể bao gồm tất cả mọi thứ. Bạn sẽ cần phải làm việc rất chăm chỉ.
Hãy thử xem. Khóa học sụp đổ cho AlphaZero.
1. Hiểu biết cơ bản về học máy
Vô số sách. Nhưng nếu bạn không có thời gian, tôi muốn giới thiệu các khóa học máy của Giáo sư Andrew Ng trên Coursera.
Từ khóa của bạn: bộ đào tạo, bộ kiểm tra, độ dốc ngẫu nhiên, tốc độ học tập, GPU, chức năng chi phí, entropy chéo .
2. Mạng trung tính sâu
Bạn cần hiểu về mạng lưới thần kinh. Tôi muốn giới thiệu cuốn sách học sâu của giáo sư Ian Goodfellow nếu bạn nghiêm túc. Nếu bạn không có thời gian, xin vui lòng theo dõi lại khóa học trực tuyến của Giáo sư Andrew Ng trên Coursera. Bạn không cần phải đi qua tất cả các chương (nhưng bạn nên!).
YouTube có nhiều giới thiệu nhanh về các mạng thần kinh, hãy thử chúng.
Từ khóa của bạn: nơ ron, lớp, trọng lượng, sai lệch, lô nhỏ, kích hoạt .
3. Tìm kiếm cây Monte Carlo
Bạn nên hiểu Monte Carlo là gì. Sách về Monte Carlo có ở khắp mọi nơi trên Amazon. Đọc wikipedia về MCTS nếu bạn không có thời gian.
Từ khóa của bạn: lấy mẫu, mở rộng, mô phỏng, triển khai, backpropagation .
3. Học tăng cường
Từ khóa của bạn: độ dốc chính sách, độ dốc gốc, tỷ lệ học tập
5. Đại diện bàn cờ
Bản thân giấy là đơn giản nhất. Mô hình mã hóa trạng thái bảng (ví dụ như các mảnh) dưới dạng một chuỗi các giá trị nhị phân mã hóa một nóng.
6. MCTS vs alpha-beta