15
n-gram trong trăn, bốn, năm, sáu gram?
Tôi đang tìm cách chia văn bản thành n-gram. Thông thường tôi sẽ làm một cái gì đó như: import nltk from nltk import bigrams string = "I really like python, it's pretty awesome." string_bigrams = bigrams(string) print string_bigrams Tôi biết rằng nltk chỉ cung cấp bigram và trigram, nhưng …