Đây sẽ không phải là một câu trả lời như một bình luận.
Chất lượng phụ thuộc vào một số điều, bao gồm (như Aaron đã nói ở trên) 1) cặp ngôn ngữ và 2) chủ đề, nhưng cũng có 3) chi và 4) kiểu của bản gốc và 5) số lượng văn bản song song bạn có để đào tạo hệ thống MT.
Để thiết lập giai đoạn, hầu như tất cả các MT ngày nay đều dựa trên các văn bản song song, đó là một văn bản bằng hai ngôn ngữ khác nhau, với một ngôn ngữ có thể là bản dịch của ngôn ngữ kia (hoặc cả hai đều là bản dịch của ngôn ngữ thứ ba); và có khả năng sử dụng từ điển (có lẽ được hỗ trợ bởi các quá trình hình thái) làm backoff khi các văn bản song song không chứa các từ cụ thể.
Hơn nữa, như những người khác đã nói, một hệ thống MT không có cách nào hiểu được các văn bản mà nó dịch; nó chỉ nhìn thấy các chuỗi ký tự, và các chuỗi từ được tạo thành từ các ký tự, và nó tìm kiếm các chuỗi và chuỗi tương tự trong các văn bản được dịch trước đó. (Ok, nó hơi phức tạp hơn thế, và đã có những nỗ lực để đạt được ngữ nghĩa trong các hệ thống tính toán, nhưng hiện tại, nó chủ yếu là các chuỗi.)
1) Ngôn ngữ khác nhau. Một số ngôn ngữ có rất nhiều hình thái, có nghĩa là chúng làm mọi việc với một từ duy nhất mà các ngôn ngữ khác làm với một vài từ. Một ví dụ đơn giản sẽ là tiếng Tây Ban Nha 'cantaremos' = tiếng Anh "chúng tôi sẽ hát". Và một ngôn ngữ có thể làm những việc mà ngôn ngữ kia thậm chí không bận tâm, như sự phân biệt không chính thức / chính thức (tu / ust) trong tiếng Tây Ban Nha, mà tiếng Anh không có tương đương. Hoặc một ngôn ngữ có thể làm những việc với hình thái mà ngôn ngữ khác làm với trật tự từ. Hoặc tập lệnh mà ngôn ngữ sử dụng có thể không đánh dấu ranh giới từ (tiếng Trung Quốc và một vài chữ khác). Hai ngôn ngữ càng khác nhau, hệ thống MT sẽ càng khó dịch giữa chúng. Các thí nghiệm đầu tiên trong MT thống kê được thực hiện giữa tiếng Pháp và tiếng Anh,
2) Chủ đề: Nếu bạn có các văn bản song song trong Kinh thánh (điều này đúng với gần như bất kỳ cặp ngôn ngữ viết nào) và bạn huấn luyện hệ thống MT của mình khỏi những ngôn ngữ đó, đừng hy vọng nó sẽ làm tốt các văn bản kỹ thuật. (Chà, dù sao thì Kinh thánh là một lượng văn bản tương đối nhỏ theo tiêu chuẩn đào tạo hệ thống MT, nhưng giả vờ :-).) Từ vựng của Kinh thánh rất khác so với các văn bản kỹ thuật, và tần số của các ngữ pháp khác nhau cũng vậy. công trình xây dựng. (Ngữ pháp về cơ bản là giống nhau, nhưng trong tiếng Anh, ví dụ, bạn nhận được nhiều giọng nói thụ động hơn và nhiều danh từ ghép trong các văn bản khoa học và kỹ thuật.)
3) Genera: Nếu văn bản song song của bạn là tất cả khai báo (như hướng dẫn sử dụng máy kéo, giả sử), cố gắng sử dụng hệ thống MT kết quả trên hộp thoại sẽ không mang lại cho bạn kết quả tốt.
4) Phong cách: Hãy nghĩ Hilary so với Donald; uyên bác so với phổ biến. Đào tạo về một người sẽ không có kết quả tốt về người khác. Tương tự, đào tạo hệ thống MT trên tiểu thuyết cấp người lớn và sử dụng nó trên sách thiếu nhi.
5) Cặp ngôn ngữ: Tiếng Anh có rất nhiều văn bản và cơ hội tìm thấy văn bản trong một số ngôn ngữ khác song song với một văn bản tiếng Anh nhất định cao hơn nhiều so với cơ hội tìm thấy các văn bản song song trong tiếng Nga và tiếng Igbo. (Điều đó nói rằng, có thể có ngoại lệ, như ngôn ngữ của Ấn Độ.) Là một khái quát chung, bạn càng có nhiều văn bản song song như vậy để đào tạo hệ thống MT, kết quả tốt hơn.
Tóm lại, ngôn ngữ rất phức tạp (đó là lý do tại sao tôi yêu nó - tôi là một nhà ngôn ngữ học). Vì vậy, không có gì ngạc nhiên khi các hệ thống MT không luôn hoạt động tốt.
BTW, dịch giả của con người cũng không phải lúc nào cũng làm tốt như vậy. Một hoặc hai thập kỷ trước, tôi đã nhận được các bản dịch tài liệu từ người dịch sang tiếng Anh, để được sử dụng làm tài liệu đào tạo cho các hệ thống MT. Một số bản dịch rất khó hiểu và trong một số trường hợp chúng tôi nhận được bản dịch từ hai (hoặc nhiều) người dịch, thật khó tin những người dịch đã đọc cùng một tài liệu.
Và cuối cùng, có (hầu như) không bao giờ chỉ một bản dịch chính xác; có nhiều cách dịch một đoạn văn, có thể tốt hơn hoặc ít hơn, tùy thuộc vào tính năng nào (tính chính xác về ngữ pháp, phong cách, tính nhất quán của cách sử dụng, ...) bạn muốn. Không có thước đo dễ dàng về "độ chính xác".