Google đang sử dụng các kỹ thuật và thuật toán học máy khác nhau để đào tạo và dự đoán. Các chiến lược cho việc học có giám sát quy mô lớn: 1. Mẫu phụ 2. Xấu hổ song song một số thuật toán 3. Giảm dần độ dốc phân tán 4. Đa số Bầu chọn 5. Hỗn hợp tham số 6. Hỗn hợp tham số lặp
Họ nên đào tạo và dự đoán mô hình với các kỹ thuật máy học khác nhau và sử dụng thuật toán để quyết định mô hình và dự đoán tốt nhất sẽ quay trở lại.
- Lấy mẫu phụ cung cấp hiệu suất kém hơn
- Hỗn hợp tham số cải thiện, nhưng không tốt như tất cả dữ liệu
- Các thuật toán phân tán trả về phân loại tốt hơn nhanh hơn
- Hỗn hợp tham số lặp đạt được tốt như tất cả dữ liệu
Nhưng tất nhiên nó không thực sự rõ ràng trong tài liệu API.