Với sự bối rối, bạn đang cố gắng đánh giá sự giống nhau giữa phân phối mã thông báo (trong trường hợp của bạn có thể là câu) được tạo bởi mô hình và mô hình trong dữ liệu thử nghiệm.
Ví dụ, giả sử bạn có M câu phù hợp S1, ... ,SM, mỗi cái có xác suất P(STôi), sự bối rối là 2- tôi,
Ở đâu l =1MΣ P(STôi) đăng nhậpP(STôi) cho i ∈ [ 1 ... M].
Lưu ý rằng mặc dù sự lúng túng có thể hữu ích để nắm bắt các khía cạnh nhất định của mô hình, nhưng nó không có nghĩa là hoàn hảo, và ngay cả khi bạn có thể đạt được điểm số lúng túng tuyệt vời, nó sẽ không nhất thiết phải dịch sang một bot trò chuyện tốt hoặc thậm chí hoạt động tốt.