có thể đưa ra quy tắc ước tính ngón tay cái về kích thước của các mạng thần kinh có thể huấn luyện được trên các GPU cấp tiêu dùng thông thường không? Ví dụ:
Sự xuất hiện của giấy Locomotion (Củng cố) đào tạo một mạng bằng cách sử dụng kích hoạt tanh của các tế bào thần kinh. Họ có NN 3 lớp với 300.200.100 chiếc cho Planar Walker . Nhưng họ không báo cáo phần cứng và thời gian ...
Nhưng một quy tắc của ngón tay cái có thể được phát triển? Cũng chỉ dựa trên kết quả thực nghiệm hiện tại, ví dụ:
Các đơn vị X sử dụng kích hoạt sigmoid có thể chạy Y lặp lại mỗi giờ trên 1060.
Hoặc sử dụng chức năng kích hoạt a thay vì b làm giảm hiệu suất.
Nếu một sinh viên / nhà nghiên cứu / tâm trí tò mò sẽ mua GPU để chơi xung quanh với các mạng này, làm thế nào để bạn quyết định những gì bạn nhận được? 1060 rõ ràng là tùy chọn ngân sách cấp nhập cảnh, nhưng làm thế nào bạn có thể đánh giá nếu nó không thông minh hơn khi chỉ lấy một chiếc netbook xù xì thay vì xây dựng một máy tính để bàn công suất cao và chi tiêu tiết kiệm cho cơ sở hạ tầng đám mây theo yêu cầu.
Động lực cho câu hỏi: Tôi vừa mua 1060 và (thông minh, để đặt câu hỏi sau đó huh) tự hỏi liệu tôi có nên giữ $ và tạo tài khoản Google Cloud không. Và nếu tôi có thể chạy mô phỏng luận văn thạc sĩ trên GPU.