Đây là lời giải thích trực tiếp từ nguồn (gần như)
lúc tối 22:03
Đáng để xem!
Về cơ bản và theo Douglas Merrill, cựu CTO của Google, nó giống như thế này:
1) Bạn viết một từ (sai chính tả) trong google
2) Bạn không tìm thấy những gì bạn muốn (không nhấp vào bất kỳ kết quả nào)
3) Bạn nhận ra mình đã viết sai chính tả nên bạn viết lại từ đó trong hộp tìm kiếm.
4) Bạn tìm thấy những gì bạn muốn (bạn nhấp vào liên kết đầu tiên)
Mẫu này được nhân lên hàng triệu lần, cho thấy những lỗi chính tả phổ biến nhất và những sửa lỗi "phổ biến nhất" là gì.
Bằng cách này, Google có thể gần như ngay lập tức, cung cấp sửa lỗi chính tả trong mọi ngôn ngữ.
Ngoài ra, điều này có nghĩa là nếu qua đêm mọi người bắt đầu đánh vần đêm là "nigth" google sẽ đề xuất từ đó thay thế.
BIÊN TẬP
@ThomasRutter: Douglas mô tả nó là "máy học thống kê".
Họ biết ai sửa truy vấn, vì họ biết truy vấn nào đến từ người dùng nào (sử dụng cookie)
Nếu người dùng thực hiện một truy vấn và chỉ 10% người dùng nhấp vào kết quả và 90% quay lại và nhập một truy vấn khác (với từ đã sửa) và lần này 90% nhấp vào kết quả, thì họ biết rằng họ đã tìm thấy một điểm chính xác.
Họ cũng có thể biết nếu đó là những truy vấn "có liên quan" của hai loại khác nhau, bởi vì chúng có thông tin của tất cả các liên kết mà chúng hiển thị.
Hơn nữa, giờ đây họ đang đưa ngữ cảnh vào kiểm tra chính tả, vì vậy họ thậm chí có thể đề xuất các từ khác nhau tùy thuộc vào ngữ cảnh.
Xem bản demo này của google wave (@ 44m 06s) để biết cách ngữ cảnh được đưa vào tài khoản để tự động sửa lỗi chính tả.
Ở đây nó được giải thích làm thế nào mà xử lý ngôn ngữ tự nhiên hoạt động.
Và cuối cùng ở đây là một bản demo tuyệt vời về những gì có thể được thực hiện bằng cách thêm dịch máy tự động (@ 1h 12m 47s) vào hỗn hợp.
Tôi đã thêm các neo của phút và giây vào video để bỏ qua trực tiếp nội dung, nếu chúng không hoạt động, hãy thử tải lại trang hoặc cuộn bằng tay để đánh dấu.