Làm thế nào để bạn xác định bộ ký tự của shapefile?


25

Có cách nào để xác định bộ ký tự được sử dụng cho một shapefile nhất định không?

Câu trả lời:


9

Phep thử va lôi sai. Hãy thử mở tệp .dbf bằng Ms Excel hoặc với OpenOffice bằng các cài đặt khác nhau cho đến khi bạn làm mọi thứ đúng.

Nhìn vào bài đăng này để biết thêm manh mối: /programming/319095/how-do-i-determine-the-character-set-of-a-opes


Nếu không có gì được biết về mã hóa, thì đáng để thử Latin1 hoặc UTF-8 trước tiên.
krlmlr

Tôi đã mở .dbf trong Ms Excel và các ký tự hiển thị bình thường. Làm cách nào tôi có thể xem mã hóa Excel nào đang sử dụng / phát hiện? Để tôi có thể đặt nó trong QGIS ...
user3386170

12

Có hai cách để các chương trình xác định bộ ký tự cho một shapefile.


+1 Liên kết đến trang định dạng tệp dBase là tuyệt vời. Tuy nhiên, AFAIK, tiền mã hóa không bao giờ được bao gồm trong định dạng dBase III. Tham chiếu có phần mở rộng định dạng FoxPro, cho thấy không phải tất cả các tệp .dbf sẽ có thông tin về mã hóa trong đó (hoặc nếu có, đó có thể là kết quả của các byte rác xuất hiện trong vùng trống của tiêu đề ). Nhưng nếu bạn có thể khai thác thông tin này, thì đây vẫn là một khởi đầu tốt cho tìm kiếm thử và sai. BTW, chào mừng đến với trang web của chúng tôi!
whuber

Một số thư viện dbf python có thể đọc codepage nếu có thông tin.
Paulo Scardine

5

Các filetiện ích có khả năng đoán bảng mã của một tập tin văn bản. Sử dụng ogr2ogrcho một chuyển đổi bảo tồn mã hóa ban đầu nếu không có .cpgtệp :

ogr2ogr -f CSV file.csv file.dbf
file file.csv

Ví dụ đầu ra:

file.csv: ISO-8859 text

Tôi đã thử nghiệm nó với hai trong số các bảng mã thường xuyên nhất, UTF-8 và latin1. Hoạt động vượt trội trong Ubuntu, không chắc chắn về OS X. Tôi không biết về filetiện ích trên Windows.

LƯU Ý : Ngay sau khi có một .cpgtệp tương ứng chỉ ra mã hóa, ogr2ogrsẽ tôn trọng nó và đầu ra sẽ ở dạng UTF-8. Nhưng nếu đầu ra CSV có vẻ đúng, bạn biết rằng thông tin trong .cpgtệp là chính xác.


Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.