Câu hỏi được gắn thẻ «unicode»

Unicode là một tiêu chuẩn để mã hóa, biểu diễn và xử lý văn bản với mục đích hỗ trợ tất cả các ký tự cần thiết cho văn bản viết kết hợp tất cả các hệ thống chữ viết, ký hiệu kỹ thuật và dấu câu.





12
UTF-8, UTF-16 và UTF-32
Sự khác biệt giữa UTF-8, UTF-16 và UTF-32 là gì? Tôi hiểu rằng tất cả chúng sẽ lưu trữ Unicode và mỗi loại sử dụng một số byte khác nhau để thể hiện một ký tự. Có một lợi thế để chọn cái này hơn cái kia không?
487 unicode  utf-8  utf-16  utf  utf-32 

12
Lưu văn bản utf-8 trong json.dumps dưới dạng UTF8, không phải là chuỗi thoát \ u
mã mẫu: >>> import json >>> json_string = json.dumps("ברי צקלה") >>> print json_string "\u05d1\u05e8\u05d9 \u05e6\u05e7\u05dc\u05d4" Vấn đề: nó không thể đọc được. Người dùng (thông minh) của tôi muốn xác minh hoặc thậm chí chỉnh sửa các tệp văn bản bằng các kết xuất JSON (và tôi không muốn sử …
474 python  json  unicode  utf-8  escaping 


18
UnicodeDecodeError khi đọc tệp CSV trong Pandas bằng Python
Tôi đang chạy một chương trình đang xử lý 30.000 tệp tương tự. Một số ngẫu nhiên trong số họ đang dừng và tạo ra lỗi này ... File "C:\Importer\src\dfman\importer.py", line 26, in import_chr data = pd.read_csv(filepath, names=fields) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 400, in parser_f return _read(filepath_or_buffer, kwds) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line …


9
Unicode, UTF-8, UTF-16 là gì?
Cơ sở cho Unicode là gì và tại sao cần UTF-8 hoặc UTF-16? Tôi đã nghiên cứu điều này trên Google và cũng đã tìm kiếm ở đây nhưng nó không rõ ràng với tôi. Trong VSS khi thực hiện so sánh tệp, đôi khi có một thông báo cho …

5
Tại sao 2+ 40 bằng 42?
Tôi đã gặp khó khăn khi một đồng nghiệp chỉ cho tôi dòng JavaScript cảnh báo 42 này. alert(2+ 40); Chạy đoạn mãẨn kết quảMở rộng đoạn trích Nó nhanh chóng chỉ ra rằng những gì trông giống như một dấu trừ thực sự là một ký tự Unicode phức …



6
Cách tìm độ dài của chuỗi trong R
Làm thế nào để tìm độ dài của một chuỗi (số ký tự trong một chuỗi) mà không tách nó trong R? Tôi biết cách tìm độ dài của danh sách nhưng không phải là chuỗi. Còn chuỗi Unicode thì sao? Làm cách nào để tìm độ dài (tính bằng …


Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.