Tôi đã có một số ít các trò chơi chữ cạnh tranh đang diễn ra và trong khi ưu tiên dành cho (chủ yếu là không đồng bộ) để chơi với các đối thủ khác của con người, tôi muốn cung cấp cho người chơi tùy chọn chơi với AI. Tôi có từ điển của mình và tôi có thể dễ dàng cung cấp kiến thức từ điển đầy đủ cho AI khi chơi, nhưng mối quan tâm của tôi là việc AI thường xuyên chơi những từ mà họ không quen thuộc sẽ là một trải nghiệm khó chịu cho người chơi: 'Tôi sẽ thắng trò chơi đó nếu nó chỉ sử dụng những từ tôi biết! ' - ngay cả khi mức độ kỹ năng tổng thể của AI bị từ chối.
Tôi muốn tạo ra một AI yếu hơn thông qua sự kết hợp của (không) các tham số chơi được điều chỉnh và từ vựng yếu hơn - nhưng tôi không chắc làm thế nào để giới hạn từ vựng đó thành các từ 'phổ biến'. Tôi đã xem xét một số danh sách tần suất từ (ví dụ: danh sách tất cả các từ xuất hiện trong sách Project Gutenberg, được sắp xếp theo số lần xuất hiện) nhưng tất cả chúng đều có một số phủ định sai: những từ mà mọi người đều biết rằng đơn giản là không ' t hiển thị với bất kỳ tần số thực nào (ví dụ, CHEETAH xuất hiện ít thường xuyên hơn trong các văn bản PG so với VOCECT hoặc SUTTEE). Tôi đã thử sử dụng kết quả tìm kiếm để có được ước tính về mức độ phổ biến của một từ, nhưng chúng cũng có xu hướng dễ bị ước tính sai, và dĩ nhiên là như vậy '
Có ai có đề xuất về các phương tiện tốt khác để xác định tần suất sử dụng từ thô, hoặc các cách khác để hạn chế trò chơi chữ AI sẽ tạo cảm giác tự nhiên cho người chơi không?