DeepMind tuyên bố rằng mạng Q sâu (DQN) của họ có thể liên tục điều chỉnh hành vi của nó trong khi học chơi 49 trò chơi Atari.
Sau khi học tất cả các trò chơi có cùng mạng lưới thần kinh, tác nhân có thể chơi tất cả các trò chơi ở cấp độ 'siêu phàm' (bất cứ khi nào nó được trình bày ngẫu nhiên với một trong các trò chơi) hoặc chỉ có thể chơi tốt một trò chơi tại một thời điểm vì chuyển đổi yêu cầu học lại?