Tôi muốn gọi một tiện ích dòng lệnh trong Mac OS X 10.8 cung cấp cho tôi khả năng chuyển đổi tệp văn bản được lưu trong mã hóa Western Mac OS Roman tiêu chuẩn sang UTF-8 chung chung hơn.
Tôi sẽ gọi tiện ích từ AppleScript mà tôi đã tạo. AppleScript cực kỳ chậm khi làm việc với các khối văn bản rất lớn. Như vậy, tôi muốn thực hiện phân tích cú pháp và chuyển đổi văn bản của mình bằng dòng lệnh OS X. Tôi đã tìm thấy một công cụ gọi là "sed", cho phép tôi thực hiện phân tích cú pháp văn bản. Tuy nhiên, vẫn còn nhiều yếu tố của tệp cần được dọn sạch, các ký tự xuất hiện dưới dạng rác nếu tệp được mở dưới dạng utf-8 (ví dụ: dấu ngoặc kép thông minh và dấu chấm lửng).
Tôi nghĩ rằng việc buộc chuyển đổi mã hóa văn bản có thể giúp loại bỏ tất cả các ký tự không phải là utf8 trong tệp. Tuy nhiên, tôi không thể thấy "sed" có thể dễ dàng chuyển đổi mã hóa văn bản như thế nào.
Tôi đã lưu tệp temp txt, như MacRoman, vào đĩa bằng cách sử dụng các thường trình AppleScript tích hợp.
Có ai trong số các bạn có bất kỳ ý tưởng nào về một công cụ dòng lệnh tích hợp có thể chuyển đổi mã hóa văn bản không? Dòng lệnh cho hiệu suất và tích hợp sẵn, vì những người dùng khác trong tập lệnh của tôi sẽ không nhất thiết phải có bộ công cụ phù hợp nếu nó không được tích hợp sẵn.
Cảm ơn bạn đã giúp đỡ!