Sách về học tập tăng cường

9

Tôi đã cố gắng để hiểu học tăng cường trong một thời gian khá lâu, nhưng bằng cách nào đó tôi không thể hình dung được cách viết một chương trình học tăng cường để giải quyết vấn đề thế giới lưới. Bạn có thể gợi ý cho tôi một số sách giáo khoa giúp tôi xây dựng một quan niệm rõ ràng về Học tập Củng cố không?

machine-learning books reinforcement-learning

— cô gái 101
nguồn

stats.stackexchange.com/questions/130130/ Ấn

— Anton Tarasenko

Vui lòng tham khảo openai cũng là một nơi tốt để tìm hiểu Học tăng cường từ con trăn về cơ bản

— Vineet Kothari

7

Ở đây bạn có một số tài liệu tham khảo tốt về Học tăng cường:

Cổ điển

Sutton RS, Barto AG. Học tăng cường: Giới thiệu. Cambridge, Mass: Một cuốn sách của Warren; 1998. 322 tr.

Bản nháp cho phiên bản thứ hai có sẵn miễn phí: http://incompleteideas.net/book/the-book-2nd.html

Russell / Norvig Chương 21:

Russell SJ, Norvig P, Davis E. Trí tuệ nhân tạo: một cách tiếp cận hiện đại. Thượng Yên River, NJ: Hội trường Prentice; 2010.

Thêm kỹ thuật

Szepesvári C. Thuật toán học tăng cường. Bài giảng tổng hợp về trí tuệ nhân tạo và học máy. 2010; 4 (1): 1 Từ 103. http://www.ualberta.ca/~szepesva/RLBook.html

Bertsekas DP. Lập trình động và điều khiển tối ưu. Tái bản lần thứ 4 Belmont, Mass.: Athena Khoa học; Năm 2007 1270 tr. Chương 6, tập 2 có sẵn miễn phí: http://web.mit.edu/dimitrib/www/dpch CHƯƠNG.pdf

Đối với những phát triển gần đây

Wiering M, van Otterlo M, biên tập viên. Học tăng cường. Berlin, Heidelberg: Mùa xuân Berlin Heidelberg; 2012 Có sẵn từ: http://link.springer.com/10.1007/978-3-642-27645-3

Kochenderfer MJ, Amato C, Chowdhary G, How JP, Reynold HJD, Thornton JR, et al. Ra quyết định theo sự không chắc chắn: Lý thuyết và ứng dụng. 1 phiên bản. Cambridge, Massachusetts: Báo chí MIT; 2015. 352 tr.

Học tăng cường đa tác nhân

Buşoniu L, Babuška R, Schutter BD. Học tập tăng cường đa tác nhân: Tổng quan. Trong: Srinivasan D, Jain LC, biên tập viên. Những đổi mới trong hệ thống và ứng dụng đa tác nhân - 1. Mùa xuân Berlin Heidelberg; 2010 trang. 183 Gian21. Có sẵn từ: http://link.springer.com/ch CHƯƠNG / 10.1007/978-3-642-14435-6_7

Schwartz HM. Học máy đa tác nhân: một cách tiếp cận củng cố. Hoboken, New Jersey: Wiley; 2014.

Video / Khóa học

Tôi cũng sẽ đề xuất khóa học David Silver trong YouTube: https://www.youtube.com/playlist?list=PL5X3mDkKaJrL42i_jhE4N-p6E2Ol62Ofa

— Juan Leni
nguồn

7

Có một khóa học trực tuyến miễn phí về Học tập Củng cố bởi Udacity. Kiểm tra: Học máy: Học tăng cường

— Sreejithc321
nguồn

Đáng nói là một vấn đề thế giới lưới được trình bày như một phần của khóa học đó.

— Neil Slater

vâng, đã thấy điều đó, nhưng không đủ để mã giống nhau

— cô gái 101

4

Tôi thực sự rất thích Củng cố Leraning: Một lời giới thiệu của Richard Sutton. Nó cung cấp một cái nhìn thống nhất rất tốt đẹp về RL, mặc dù nó không đề cập đến các phương pháp mới nhất (từ năm 1998).

— Martin Modrák
nguồn

thực sự tôi muốn thấy một vấn đề thế giới lưới đang được giải quyết bằng cách tính toán trên bút và giấy, bởi vì điều đó sẽ giúp tôi hiểu khái niệm này, trừ khi tôi có thể hiểu khái niệm tôi không thể mã hóa (đặc biệt là giá trị lặp lại)

— girl101

1

Bạn có thể xem cuốn sách của tôi - Học tăng cường thực hành với Python giải thích việc học tăng cường từ đầu đến trạng thái tiên tiến của thuật toán học tăng cường sâu nghệ thuật.

Tất cả các mã cùng với lời giải thích đã có sẵn trong repo github của tôi. https://github.com/sudharsan13296/Hands-On-Reinfor thi-Learning-With-Python

— Sudharsan
nguồn