Từ những gì tôi đã thấy, công thức làm mịn Kneser-Ney (bậc hai) theo cách này hay cách khác được đưa ra như
với hệ số chuẩn hóa được cho là
và xác suất tiếp tục của một từ
Trong đó là số lượng bối cảnh được nhìn thấy trong hoặc đơn giản hơn, số lượng từ khác biệt đứng trước từ đã cho . Từ những gì tôi đã hiểu, công thức có thể được áp dụng đệ quy.
Bây giờ, điều này xử lý các từ đã biết trong ngữ cảnh không xác định độc đáo cho các độ dài n-gram khác nhau, nhưng điều không giải thích được là phải làm gì khi có các từ ngoài từ điển. Tôi đã thử làm theo ví dụ này trong đó nói rằng trong bước đệ quy cho unigram, . Tài liệu sau đó sử dụng điều này - trích dẫn Chen và Goodman - để biện minh cho công thức trên là .
Tôi không thấy nó hoạt động như thế nào khi có một từ chưa biết . Trong những trường hợp này, vì rõ ràng, từ chưa biết không tiếp tục bất cứ điều gì liên quan đến tập huấn luyện. Tương tự, số lượng n-gram sẽ là .P c o n t ( chưa biết ) = 0 C(wn-1,chưa biết)=0
Hơn nữa, toàn bộ thuật ngữ có thể bằng 0 nếu gặp phải một chuỗi các từ chưa biết - giả sử, một bát quái của các từ 3M - gặp phải.
Tôi đang thiếu gì?