Tôi đã sử dụng GNU SED trong vài năm nay rồi. Đôi khi nó làm tôi phát điên lên, nhưng nó làm rất tốt ... đối với các tập char đơn byte!
Bây giờ tôi nhận thấy các tham chiếu đến GNU SED là nhận thức về Unicode, nhưng gần nhất tôi thấy điều này là chế độ "nhị phân" của nó .. và nhị phân không phải là Unicode.
GSED có thể xử lý tệp văn bản Unicode ở độ phân giải CodePoint, bao gồm và đặc biệt là \ r \ n (Windows) ... và nếu có thể, nó có mong đợi UTF-8, UTF-16 hay không? và SED phát hiện mã hóa như thế nào?