1
Làm thế nào chính xác để tính toán Hàm mất Q-Learning sâu?
Tôi nghi ngờ về cách chính xác chức năng mất của Mạng Q-Learning sâu được đào tạo. Tôi đang sử dụng một mạng feedforward 2 lớp với lớp đầu ra tuyến tính và các lớp ẩn relu. Giả sử tôi có 4 hành động có thể. Do đó, đầu ra …