Tôi có một vài cuốn sách ở định dạng in. Chúng được dịch từ tiếng Anh sang tiếng Na Uy trước khi máy tính là dòng chính, vì vậy tôi đã chạy bản dịch qua máy quét và OCR-ed. Phiên bản tiếng Anh đã được số hóa.
Có những lỗi OCR mà tôi cần sửa, và tôi cũng cần ghép các đoạn trong bản dịch tiếng Na Uy với bản gốc tiếng Anh.
Có vẻ như tôi nên sử dụng một số chương trình Bộ nhớ dịch như Zanata làm công cụ và kho lưu trữ cho các bản dịch, nhưng trước khi tôi có thể làm điều đó, tôi cần tạo một tệp TMX khớp với các phân đoạn giữa các bản dịch hiện có
Bất cứ ý tưởng làm thế nào tôi có thể đi về làm điều đó? Hay tôi đang tấn công vấn đề này ở góc độ sai?