OK, một câu trả lời mới cho một câu hỏi cũ nhưng thậm chí còn phù hợp hơn bây giờ. Câu hỏi bạn đặt ra phải làm với độ chính xác hữu hạn, thông thường là lĩnh vực phân tích tín hiệu và toán học thực nghiệm.
Phao chính xác kép (DP) cho phép chúng ta giả vờ rằng các vấn đề chính xác hữu hạn không tồn tại, giống như chúng ta làm với hầu hết các vấn đề toán học trong thế giới thực. Trong toán học thực nghiệm không có giả vờ.
Phao chính xác đơn (SP) buộc chúng ta phải xem xét nhiễu lượng tử hóa. Nếu các mô hình học máy của chúng ta vốn đã loại bỏ nhiễu, chẳng hạn như lưới thần kinh (NN), lưới chập (CNN), lưới dư (ResN), v.v., thì SP thường cho kết quả tương tự với DP.
Phao một nửa độ chính xác (HP) (hiện được hỗ trợ trong bộ công cụ cuda 7.5) yêu cầu các hiệu ứng lượng tử hóa (nhiễu và làm tròn) được xem xét. Rất có thể chúng ta sẽ sớm thấy HP nổi trong các bộ công cụ học máy phổ biến.
Có công việc gần đây để tạo ra các tính toán độ chính xác thấp hơn trong phao cũng như các số chính xác cố định. Làm tròn ngẫu nhiên đã cho phép hội tụ để xử lý các CNN trong khi giải pháp phân kỳ mà không có nó. Những bài viết này sẽ giúp bạn cải thiện sự hiểu biết của bạn về các vấn đề với việc sử dụng các số chính xác hữu hạn trong học máy.
Để giải quyết câu hỏi của bạn:
SP không quá tệ. Khi bạn chỉ ra nó nhanh gấp đôi, nhưng nó cũng cho phép bạn đặt nhiều lớp hơn vào bộ nhớ. Một phần thưởng là trong việc tiết kiệm chi phí nhận dữ liệu trên và ngoài gpu. Các tính toán nhanh hơn và kết quả trên không thấp hơn trong thời gian hội tụ thấp hơn. Điều đó nói rằng, HP, đối với một số vấn đề, sẽ tốt hơn ở một số phần của mạng chứ không phải ở các phần khác.
- Dường như với tôi, nhiều bộ công cụ học máy xử lý SP và DP. Có lẽ ai đó có phạm vi kinh nghiệm rộng hơn với bộ công cụ sẽ thêm biệt hiệu của họ.
- Python sẽ hỗ trợ những gì bộ công cụ gpu hỗ trợ. Bạn không muốn sử dụng các loại dữ liệu python vì sau đó bạn sẽ chạy tập lệnh được diễn giải trên cpu.
Lưu ý rằng xu hướng trong các mạng thần kinh bây giờ là đi với các lớp rất sâu, với các hoạt động kéo dài hơn một vài ngày trên các cụm gpu nhanh nhất.