Điều gì đằng sau API dự đoán của Google?


28

API dự đoán của Google là một dịch vụ đám mây nơi người dùng có thể gửi một số dữ liệu đào tạo để huấn luyện một số phân loại bí ẩn và sau đó yêu cầu nó phân loại dữ liệu đến, ví dụ để triển khai các bộ lọc spam hoặc dự đoán tùy chọn của người dùng.

Nhưng đằng sau hậu trường là gì?


2
Tôi nghi ngờ họ đang hy vọng giữ bí mật về mặt thương mại!
vào

Điều này có thể đúng, tuy nhiên video (từ mùa hè 2010) cho thấy rằng họ vẫn đang thử nghiệm vào thời điểm đó; Vì vậy, tôi đã đăng Q này với hy vọng rằng một số rò rỉ đã xuất hiện kể từ đó.

6
Có một số thuật toán mà API Dự đoán có thể chọn khi đào tạo / dự đoán dữ liệu của bạn. Động cơ chọn cái mà nó quyết định là tốt nhất. Một số người dùng đã yêu cầu kiểm soát nhiều hơn một chút đối với lựa chọn đó, goo.gl/mod/5EoA , ngay cả khi thuật toán không xác định. Redditor đã suy đoán về sự can đảm ở đây, reddit.com/r/MachineLearning/comments/evdxb/ , nhưng stat-speak bị mất đối với tôi.
hyperslug

2
@hyperslug Đăng nó dưới dạng câu trả lời, nó khá hữu ích vì vậy tôi muốn chấp nhận nó.

Câu trả lời:


11

Google đang sử dụng các kỹ thuật và thuật toán học máy khác nhau để đào tạo và dự đoán. Các chiến lược cho việc học có giám sát quy mô lớn: 1. Mẫu phụ 2. Xấu hổ song song một số thuật toán 3. Giảm dần độ dốc phân tán 4. Đa số Bầu chọn 5. Hỗn hợp tham số 6. Hỗn hợp tham số lặp

Họ nên đào tạo và dự đoán mô hình với các kỹ thuật máy học khác nhau và sử dụng thuật toán để quyết định mô hình và dự đoán tốt nhất sẽ quay trở lại.

  1. Lấy mẫu phụ cung cấp hiệu suất kém hơn
  2. Hỗn hợp tham số cải thiện, nhưng không tốt như tất cả dữ liệu
  3. Các thuật toán phân tán trả về phân loại tốt hơn nhanh hơn
  4. Hỗn hợp tham số lặp đạt được tốt như tất cả dữ liệu

Nhưng tất nhiên nó không thực sự rõ ràng trong tài liệu API.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.