Tài nguyên để bắt đầu với học tập củng cố sâu


7

Giả sử người học thành thạo với các mạng lưới thần kinh nhân tạo, và có một số nền tảng trong học tập củng cố. Một số tài nguyên tốt (sách / video / giấy tờ / GitHub repo / v.v.) để bắt đầu với việc học tập củng cố sâu là gì?


1
Bạn có thể kiểm tra repo github của tôi có tất cả mã và giải thích github.com/sudharsan13296/ Kẻ
Sudharsan

Câu trả lời:



4

Giới thiệu tốt về học tập củng cố sâu sắc của Lex Fridman (2019-01): https://youtu.be/zR11FLZ-O9M

2 bài đăng blog miễn phí, dễ đọc để bắt đầu học tập củng cố sâu: bài đầu tiên tập trung vào độ dốc chính sách, bài thứ hai tập trung vào học hỏi sâu.

  1. Học tập củng cố sâu: Pông từ Pixels ( gương ) của Andrej Karpathy (31 tháng 5 năm 2016).
  2. Làm sáng tỏ việc học tăng cường sâu ( gương ) của Tambet Matiise trên Nervana (ngày 21 tháng 12 năm 2015)

Sau đó, hai tài nguyên chuyên sâu hơn:

  1. 10 video, mỗi video ~ 90 phút: Các chủ đề nâng cao 2015 (COMPM050 / COMPGI13) ( gương ) về Học tập củng cố của David Silver (2015)
  2. Cuốn sách miễn phí dài 45 trang: Học tăng cường: Giới thiệu (tái bản lần 2) của Richard S. Sutton và Andrew G. Barto (2016)

Để bắt đầu mã hóa:

  1. Học tăng cường Học tập (với Mã, Bài tập và Giải pháp) ( gương ) của Denny Britz (ngày 2 tháng 10 năm 2016)
  2. Ví dụ học tập củng cố tối thiểu và sạch sẽ (2017)
  3. Sử dụng Keras và Deep Q-Network để chơi FlappyBird ( nhân bản , ) của Ben Lau (ngày 10 tháng 7 năm 2016) (mã này rất đơn giản để chạy trên Ubuntu)
  4. Sử dụng Keras và Gradient Chính sách xác định sâu để chơi TORCS ( nhân bản , ) của Ben Lau (ngày 11 tháng 10 năm 2016) (lưu ý: việc cài đặt gym_torcsyêu cầu để chạy mã có thể mất một thời gian và các hướng dẫn chỉ được cung cấp cho Linux).

Thêm liên kết:

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.