Wihle plpuoar "Cmairbgde Uirenvtisy" sduty là một cách đáng kinh ngạc , trehe đã được smoe resaerch itno tihs tpoic.
Tihs sduty sohws taht arpapent lteter szie pyals a rloe. Việc sử dụng wpckelgraihs attmepts để debcrise các Stes mối quan hệ beewten của letrets để undtrseand các pniot tại wihch một wrod là undersootd.
Vì vậy, làm thế nào để dlveeop tihs itno một aglorithm? Tôi tnihk trehe là smoe baisc stspe:
- Asisgn a szie vlaue to ecah leettr
- Đối với một wdro gievn:
- Rembmeer các szie vaule cho ecah leettr posioitn.
- Raniomdze các chữ cái với các văn bản folwoling:
- Đừng làm phiền người đầu tiên và lsat leettr để remian trong poteh retpecsive tehir
- Cố gắng aiovd planicg lertets itno "solt" của thier smae szie.
Tere là những sttaregies otehr bạn có thể emlpoy, thuogh I hvae no raseerch để bcak lên foollwing, jsut my tsoughth:
- Aptemtt để maxzmiie sự thay đổi Leveishtenn giữa wrod oiigrnal và modefiid. Tihs colud maxiimze diuficflty cho reczgnioing wrod. (Pehraps sử dụng Seeuqnce Alimngent )
- Đảo ngược odrer của ltteer berofe scramilbng, tehn mvoe ecah ltteer jsut một vài sapces tạo thành vị trí onigirus của nó. (Mbyae slhgitly sclambred wwwards wrod is mroe diffucilt?)
Cần một bản dịch?
Trong khi nghiên cứu "Cmabrigde Uinervtisy" nổi tiếng có khả năng là một trò lừa bịp , đã có một số nghiên cứu về chủ đề này.
Nghiên cứu này cho thấy kích thước chữ rõ ràng đóng một vai trò. Việc sử dụng wickelgraphs cố gắng mô tả mối quan hệ giữa các bộ chữ cái để hiểu điểm mà từ đó được hiểu.
Vậy làm thế nào để phát triển điều này thành một thuật toán? Tôi nghĩ có một số bước cơ bản:
- Gán một giá trị kích thước cho mỗi chữ cái
- Đối với một từ nhất định:
- Ghi nhớ giá trị kích thước cho từng vị trí chữ cái.
- Chọn ngẫu nhiên các chữ cái với các hạn chế sau:
- Không cho phép chữ cái đầu tiên và cuối cùng ở vị trí tương ứng của họ
- Cố gắng tránh đặt các chữ cái vào "khe" có cùng kích thước.
Có nhiều chiến lược khác bạn có thể sử dụng, mặc dù tôi không có nghiên cứu để sao lưu những điều sau đây, chỉ là suy nghĩ của tôi:
- Cố gắng tối đa hóa khoảng cách Levenshtein giữa từ gốc và từ được sửa đổi. Điều này có thể tối đa hóa khó khăn để nhận ra từ. (Có lẽ sử dụng Sắp xếp thứ tự )
- Đảo ngược thứ tự của các chữ cái trước khi xáo trộn, sau đó di chuyển mỗi chữ cái chỉ một vài khoảng cách từ vị trí ban đầu của nó. (Có lẽ hơi lộn xộn từ ngược là khó khăn hơn?)