Đây chắc chắn sẽ là một điều dễ dàng nhưng nó thực sự làm tôi khó chịu.
Tôi có một đoạn script đọc trong một trang web và sử dụng Beautiful Soup để phân tích nó. Từ súp tôi trích xuất tất cả các liên kết vì mục tiêu cuối cùng của tôi là in ra các link.contents.
Tất cả các văn bản mà tôi đang phân tích cú pháp là ASCII. Tôi biết rằng Python coi các chuỗi là unicode và tôi chắc chắn rằng điều này rất tiện dụng, chỉ là không có ích gì trong tập lệnh nhỏ của tôi.
Mỗi lần tôi đi in ra một biến chứa 'Chuỗi' tôi sẽ được [u'String']
in ra màn hình. Có một cách đơn giản để đưa nó trở lại chỉ là ascii hay tôi nên viết một biểu thức chính thức để loại bỏ nó?