Bài giảng / Sách trên AlphaGo / AlphaZero


8

Tôi rất quan tâm đến cách AlphaGo tôn trọng. AlphaZero hoạt động. Dường như với tôi, Google Papers liên quan rất dày đặc và không dễ đọc.

Có sách giáo khoa hay bài giảng nào giải thích về trình độ kỹ thuật không? Tức là bắt đầu với mạng lưới thần kinh / học sâu, Tìm kiếm cây Monte Carlo cho đến khi đạt được tại AlphaGo / AlphaZero?

Tôi có bằng thạc sĩ về khoa học máy tính, nhưng tôi chưa bao giờ làm việc với trí tuệ nhân tạo / máy học.

Ngay bây giờ tôi thấy rằng tất cả các thông tin liên quan đều nằm rải rác xung quanh và tôi không có thời gian để nghe các bài giảng (trực tuyến) về học máy có thể chỉ có 10% về những gì có liên quan để hiểu AlphaGo ...

Ai đó có thể chỉ cho tôi đi đúng hướng?



2
cảm ơn vì liên kết, nhưng bài thuyết trình đó thực sự rất hời hợt
ndbd 11/12/17

Câu trả lời:


10

BIÊN TẬP

@ unutbu's link trong bình luận là một bài giới thiệu tốt.


Sự hiểu biết vững chắc cho AlphaZero rất có thể đòi hỏi một mức độ định lượng (Tiến sĩ?). Bạn đang yêu cầu một khóa học sụp đổ trong AlphaZero?

Xin lưu ý trừ khi bạn đầu tư một lượng đáng kể thời gian của bạn, không có gì tôi nói sẽ làm việc. Không có cuốn sách nào có thể bao gồm tất cả mọi thứ. Bạn sẽ cần phải làm việc rất chăm chỉ.

Hãy thử xem. Khóa học sụp đổ cho AlphaZero.

1. Hiểu biết cơ bản về học máy

Vô số sách. Nhưng nếu bạn không có thời gian, tôi muốn giới thiệu các khóa học máy của Giáo sư Andrew Ng trên Coursera.

Từ khóa của bạn: bộ đào tạo, bộ kiểm tra, độ dốc ngẫu nhiên, tốc độ học tập, GPU, chức năng chi phí, entropy chéo .

2. Mạng trung tính sâu

Bạn cần hiểu về mạng lưới thần kinh. Tôi muốn giới thiệu cuốn sách học sâu của giáo sư Ian Goodfellow nếu bạn nghiêm túc. Nếu bạn không có thời gian, xin vui lòng theo dõi lại khóa học trực tuyến của Giáo sư Andrew Ng trên Coursera. Bạn không cần phải đi qua tất cả các chương (nhưng bạn nên!).

YouTube có nhiều giới thiệu nhanh về các mạng thần kinh, hãy thử chúng.

Từ khóa của bạn: nơ ron, lớp, trọng lượng, sai lệch, lô nhỏ, kích hoạt .

3. Tìm kiếm cây Monte Carlo

Bạn nên hiểu Monte Carlo là gì. Sách về Monte Carlo có ở khắp mọi nơi trên Amazon. Đọc wikipedia về MCTS nếu bạn không có thời gian.

Từ khóa của bạn: lấy mẫu, mở rộng, mô phỏng, triển khai, backpropagation .

3. Học tăng cường

Từ khóa của bạn: độ dốc chính sách, độ dốc gốc, tỷ lệ học tập

5. Đại diện bàn cờ

Bản thân giấy là đơn giản nhất. Mô hình mã hóa trạng thái bảng (ví dụ như các mảnh) dưới dạng một chuỗi các giá trị nhị phân mã hóa một nóng.

6. MCTS vs alpha-beta

nhập mô tả hình ảnh ở đây


4
cảm ơn rất nhiều vì câu trả lời chi tiết Vì vậy, có vẻ như không may là không có hướng dẫn thẳng. Quan điểm của tôi là tất nhiên với tư cách là một chuyên gia CS tôi biết về các mạng thần kinh, nhưng không phải là loại mạng sâu cụ thể được sử dụng trong Alpha *. Tôi đại khái biết về MCTS như được giới thiệu bởi Bernd Brügmann, nhưng không phải là loại thích ứng cụ thể cho Alpha *. Tương tự cho việc học tăng cường. Ví dụ, khóa học của Andrew Ng về ML rất rộng và bao gồm những thứ như PCA / LDA, theo như tôi biết là hoàn toàn không liên quan ở đây. Nhưng tôi đoán, sau đó tôi phải tự mình giải quyết ;-)
ndbd

7

Tôi không đủ danh tiếng để bình luận, nhưng AlphaGo Zero Explained In One Diagram khá hay.

Tôi cũng thực sự thích hướng dẫn này .

Lưu ý rằng liên kết đầu tiên không mô tả khi nào tạo (mở rộng) nút. Phần đó có thể hơi khó hiểu. Liên kết này có thể giúp đỡ.


Điều đó thật tốt. Tôi thích nó. +1.
SmallChess

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.