Câu hỏi được gắn thẻ «character-encoding»

Mã hóa ký tự đề cập đến cách các ký tự được biểu diễn dưới dạng một chuỗi byte. Mã hóa ký tự cho Web được xác định trong Tiêu chuẩn mã hóa.










12
PHP DOMDocument loadHTML không mã hóa UTF-8 chính xác
Tôi đang cố phân tích một số HTML bằng DOMDocument, nhưng khi tôi làm vậy, tôi đột nhiên mất mã hóa (ít nhất đó là cách nó xuất hiện với tôi). $profile = "<div><p>various japanese characters</p></div>"; $dom = new DOMDocument(); $dom->loadHTML($profile); $divs = $dom->getElementsByTagName('div'); foreach ($divs as $div) { echo …


11
Chuyển đổi Unicode sang ASCII mà không gặp lỗi trong Python
Mã của tôi chỉ xóa một trang web, sau đó chuyển đổi nó thành Unicode. html = urllib.urlopen(link).read() html.encode("utf8","ignore") self.response.out.write(html) Nhưng tôi nhận được một UnicodeDecodeError: Traceback (most recent call last): File "/Applications/GoogleAppEngineLauncher.app/Contents/Resources/GoogleAppEngine-default.bundle/Contents/Resources/google_appengine/google/appengine/ext/webapp/__init__.py", line 507, in __call__ handler.get(*groups) File "/Users/greg/clounce/main.py", line 55, in get html.encode("utf8","ignore") UnicodeDecodeError: 'ascii' codec can't decode …




Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.