2
Tại sao n-gram được sử dụng trong nhận dạng ngôn ngữ văn bản thay vì từ?
Trong hai thư viện nhận dạng ngôn ngữ phổ biến, Compact Language dò 2 cho C ++ và trình phát hiện ngôn ngữ cho java, cả hai đều sử dụng n-gram (dựa trên ký tự) để trích xuất các tính năng văn bản. Tại sao một túi từ (từ đơn …