Bởi "vấn đề mã hóa char có dấu" tôi có nghĩa là vấn đề đôi khi trên blog "é" trở thành "Ã ©", và vấn đề tương tự đối với các ký tự có dấu khác.
Tôi biết rằng một trong những lý do là một số cài đặt sai DB_CHARSET của cơ sở dữ liệu. Tuy nhiên, tôi nghĩ rằng, có một tiện ích mở rộng Chrome giải quyết vấn đề từ phía khách hàng. Ví dụ: nó có thể "phát hiện" các kết hợp ký tự xấu như "Ã ©", và sau đó, chỉ cần thay thế nó bằng "é", hoặc chỉ thực hiện một số mã hóa và giải mã như sau:
Nếu văn bản là
L'hypothèse de Riemann, après qu'on eut perdu l 'l' la montre insà parable de la conjecture bước đi của nghệ sĩ L les phần mở rộng cyclotomiques d'un corps de nombres donnà © jouera sans doute le rÃs
sau đó bằng cách làm .encode("Windows-1252").decode("utf-8")
nó trở thành
L'hypothèse de Riemann, après qu'on eut perdu l 'l' de de d d L, Caes deuxTHERèmes étant deux khía cạnh của câu hỏi arithmético-algébrique, où l'étude simultanée de toutes les extend
ã© instead of é