Cách tạo TMX từ các tệp TXT hiện có


1

Tôi có một vài cuốn sách ở định dạng in. Chúng được dịch từ tiếng Anh sang tiếng Na Uy trước khi máy tính là dòng chính, vì vậy tôi đã chạy bản dịch qua máy quét và OCR-ed. Phiên bản tiếng Anh đã được số hóa.

Có những lỗi OCR mà tôi cần sửa, và tôi cũng cần ghép các đoạn trong bản dịch tiếng Na Uy với bản gốc tiếng Anh.

Có vẻ như tôi nên sử dụng một số chương trình Bộ nhớ dịch như Zanata làm công cụ và kho lưu trữ cho các bản dịch, nhưng trước khi tôi có thể làm điều đó, tôi cần tạo một tệp TMX khớp với các phân đoạn giữa các bản dịch hiện có

Bất cứ ý tưởng làm thế nào tôi có thể đi về làm điều đó? Hay tôi đang tấn công vấn đề này ở góc độ sai?


1
Có vẻ "căn chỉnh bản dịch" là một thuật ngữ mô tả trên.net / online
help / across / acrossHaupt141.htmlm

Thích cái này một tag-aligner.sourceforge.net
nitech

1
Và cái này: sourceforge.net/projects/aligner - hoạt động trong Windows
nitech

Câu trả lời:


0

Nếu bạn tìm kiếm "Align Translations", bạn sẽ tìm thấy một vài công cụ được chỉ định dành riêng cho việc căn chỉnh các đoạn (hoặc câu) trong các tài liệu đã được dịch.

Tôi đã sử dụng sourceforge.net/projects/aligner , đó là biểu đồ chéo. Tôi không quá ấn tượng với công cụ này - nhưng nó hoàn thành công việc, theo như câu hỏi ở trên (nó cho phép bạn căn chỉnh văn bản và sau đó tạo tệp TMX)

Tuy nhiên, cuối cùng tôi đã rời khỏi công cụ vì một lý do không rõ ràng từ câu hỏi trên. Tôi cần bộ căn chỉnh để xuất ra một tệp văn bản khớp chính xác với bản gốc, liên quan đến số lần ngắt dòng. Mặc dù LF Aligner lưu trữ một dự án đang diễn ra trong các tệp văn bản, vẫn có một vài vấn đề:

  • Khi tôi mở một dự án lần thứ hai, một số sự sắp xếp đã bị rối tung. Cụ thể điều này liên quan đến những nơi tôi đã thêm một đoạn trống.
  • Các vấn đề chung xử lý các đoạn trống trong cả ngôn ngữ gốc và bản dịch.

Tôi sẽ thêm thông tin vào bài viết này nếu tôi tìm thấy một công cụ có thể làm điều này.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.