2
Câu hỏi về Q-Learning sử dụng Mạng thần kinh
Tôi đã triển khai Q-Learning như được mô tả trong, http://web.cs.swarthmore.edu/~meeden/cs81/s12/ con / MarkStevePaper.pdf Để khoảng. Q (S, A) Tôi sử dụng cấu trúc mạng thần kinh như sau, Kích hoạt sigmoid Đầu vào, số lượng đầu vào + 1 cho các nơ ron hành động (Tất cả các đầu …