Chất lượng thực tế của bản dịch máy là gì?


27

Đến ngày hôm nay tôi - với tư cách là một cư sĩ AI - bị bối rối bởi những cải tiến đã hứa và đạt được của dịch thuật tự động.

Ấn tượng của tôi là: vẫn còn một con đường rất, rất xa để đi. Hoặc có những giải thích khác tại sao các bản dịch tự động (được cung cấp và cung cấp bởi Google) của các bài viết Wikipedia khá đơn giản vẫn đọc và nghe chủ yếu là ngớ ngẩn, khó đọc và chỉ rất hữu ích và hữu ích?

Nó có thể phụ thuộc vào sở thích cá nhân (liên quan đến khả năng đọc, hữu ích và hữu ích), nhưng kỳ vọng cá nhân của tôi rất thất vọng.

Một cách khác: Các bản dịch của Google có thể đọc được, hữu ích và hữu ích cho đa số người dùng không?

Hay Google có lý do để giữ lại thành tích của mình (và không hiển thị cho người dùng những gì tốt nhất họ có thể hiển thị)?


Kết quả sơ bộ: Chúng ta vẫn còn xa để có thể nói chuyện với trí tuệ nhân tạo trên một nền tảng và hiểu biết ngang nhau - chỉ trên cấp độ của chuỗi. Vậy tại sao chúng ta phải sợ? Bởi vì họ biết nhiều hơn chúng ta biết - nhưng chúng ta không biết?


2
Dịch máy là một vấn đề khó, đặc biệt là vì các kỹ thuật hiện đại không cố gắng hiểu văn bản cần dịch. Điều đó hoạt động ít nhiều trong nhiều trường hợp, nhưng cũng có thể thất bại một cách ngoạn mục. Cá nhân tôi thấy rằng - mang ý nghĩa đó - hầu hết các bản dịch đều hữu ích và tôi không có lý do gì để tin rằng các công ty MT đang kìm hãm. Có thể một số ứng dụng dành riêng cho tên miền nhạy cảm hơn về mặt thương mại, nhưng MT không rộng.
Oliver Mason

@OliverMason: "các kỹ thuật hiện đại không cố gắng hiểu văn bản sẽ được dịch" - đó có phải là bản chất cần nói? Đó là cách tôi phải hiểu kết quả của MT? Buồn lắm. (Một số mâu thuẫn từ cộng đồng AI sẽ rất được hoan nghênh!)
Hans-Peter Stricker

1
@ Hans-PeterStricker: Chà, tất cả thực sự bắt đầu khi Fred Jelinek nhận thấy rằng các nhà ngôn ngữ học bắn súng làm cho trình nhận dạng giọng nói của anh ta chính xác hơn. Kể từ đó, các hình thức học máy khác nhau đã vượt qua AI dựa trên quy tắc, và bây giờ chúng tôi hiếm khi có ý tưởng mờ nhạt nhất về cách hầu hết các hệ thống AI "thực sự hoạt động" - ngoại trừ ở cấp độ ngẫu nhiên.
Kevin

2
@ Hans-PeterStricker Thật không hữu ích khi nghĩ về một hệ thống AI hiện đại là 'hiểu' một cái gì đó. Hãy nghĩ về nó nhiều hơn như một hệ thống lấy một bộ đầu vào và tạo ra một bộ đầu ra. Đầu vào có thể là một văn bản tiếng Anh và đầu ra là một văn bản tiếng Tây Ban Nha. Hệ thống này đã "học" điều này từ một loạt các văn bản tiếng Anh và các văn bản tiếng Tây Ban Nha tương đương của họ. Điều đó có nghĩa là nó hiểu tiếng Anh, hay hiểu tiếng Tây Ban Nha? Đó là nhiều hơn một câu hỏi triết lý. Điều quan trọng thực tế là nó có thể chuyển đổi tiếng Anh sang tiếng Tây Ban Nha với một mức độ tin cậy nào đó.
Josh Eller

Nó đã được chạm nhẹ vào các câu trả lời, nhưng tôi nghĩ rằng giá trị của nó chỉ ra rằng câu trả lời phụ thuộc rất nhiều vào các cặp ngôn ngữ mà bạn đang nói đến. Chất lượng nói, tiếng Anh <-> tiếng Tây Ban Nha, cao hơn rất nhiều so với tiếng Anh <-> tiếng Nhật.
mbrig

Câu trả lời:


21

Ai tuyên bố rằng dịch máy tốt như một dịch giả người? Đối với tôi, với tư cách là một dịch giả chuyên nghiệp kiếm sống nhờ dịch thuật trong 35 năm nay, MT có nghĩa là việc sản xuất dịch thuật chất lượng con người hàng ngày của tôi đã tăng lên theo yếu tố 3 đến 5, tùy thuộc vào độ phức tạp của văn bản nguồn.

Tôi không thể đồng ý rằng chất lượng của MT đi xuống cùng với độ dài của đầu vào ngoại ngữ. Điều đó từng đúng với các hệ thống cũ với các phân tích ngữ nghĩa và ngữ pháp. Tôi không nghĩ rằng tôi biết tất cả các hệ thống cũ (tôi biết Systran, một công cụ rác rưởi của Siemens đã được bán từ công ty này sang công ty tiếp theo như quà tặng của Danaer, XL8, Phiên dịch cá nhân và Dịch), nhưng thậm chí là một hệ thống chuyên nghiệp trong đó tôi đã đầu tư 28.000 DM (!!!!) thất bại thảm hại.

Ví dụ: câu:

Vào ngày hè nóng nực này tôi phải làm việc và đó là một cơn đau ở mông.

có thể được dịch bằng nhiều công cụ MT sang tiếng Đức.

Phiên dịch cá nhân 20 :

Auf dieem heißen Sommertag musste ich arbeiten, und es war ein Schmerz im Esel.

Nhắc :

Một dieem heißen Sommertag musste ich arbeiten, und es war ein Schmerz im Esel.

Sâu :

Một dieem heißen Sommertag musste ich arbeiten und es war eine Qual.

Google:

Một dieem heißen Sommertag musste ich arbeiten und es war ein Schmerz im Arsch.

Ngày nay, Google thường giới thiệu cho tôi các bản dịch dễ đọc, gần như chính xác và DeepL thậm chí còn tốt hơn. Mới sáng nay tôi đã dịch 3500 từ trong 3 giờ và kết quả thật hoàn hảo mặc dù văn bản nguồn đầy lỗi (được viết bởi tiếng Trung Quốc).


4
Đối với những người trong chúng ta không thông thạo tiếng Đức thì không rõ những lựa chọn thay thế nào là tốt và xấu. Tôi biết rằng "Esel" có nghĩa là "ass (động vật)" và "Arsch" có nghĩa là "ass (bộ phận cơ thể)". Tôi không biết "Qual" nghĩa là gì, hoặc nếu "ein Schmerz im Arsch" có thể chấp nhận được.
Stig Hemmer

3
"Schmerz im Esel" là hài hước (và sai). "Arsch" là một từ khá thông tục, mà bạn sẽ không sử dụng bằng tiếng Đức bằng văn bản. "Qual" là "nỗi đau", vì vậy IMHO là sự lựa chọn tốt hơn, mặc dù không hoàn toàn chính xác, vì câu này thể hiện sự khó chịu hơn là nỗi đau thực sự.
Oliver Mason

1
@OliverMason Qual là một bản dịch tốt: dict.leo.org/englisch-deutsch/qual
yunzen

4
@OliverMason Tôi là một người nói tiếng Đức bản địa và tôi cho rằng nó rất phù hợp
yunzen

5
@OliverMason, nỗi đau trong ass Ass là một thành ngữ. Mạo hiểm Schmerz im Arsch không phải là: không ai nói vậy. Tiêu chí chất lượng là một bản dịch chính xác của thành ngữ tiếng Anh, trái với những gì bạn nói, hiếm khi biểu thị nỗi đau thực tế, và (tương tự, có thể là đau Qual nghĩa là cả nỗi đau theo nghĩa đen và nghĩa bóng). Không có ngữ cảnh hơn nữa, bản dịch DeepL dường như là hoàn hảo.
Konrad Rudolph

7

Bản dịch của Google thể hữu ích, đặc biệt nếu bạn biết rằng bản dịch không hoàn hảo và nếu bạn chỉ muốn có ý tưởng ban đầu về ý nghĩa của văn bản (bản dịch của Google đôi khi có thể khá sai lệch hoặc không chính xác). Tôi sẽ không đề xuất bản dịch của Google (hoặc bất kỳ dịch giả không phải người nào khác) để thực hiện một bản dịch nghiêm túc, trừ khi đó có thể là một câu hoặc từ thông dụng, nó không liên quan đến các văn bản rất dài và ngôn ngữ không chính thức (hoặc tiếng lóng), các bản dịch liên quan đến Ngôn ngữ tiếng Anh hoặc bạn không có quyền truy cập vào một dịch giả người.

0100100

Trong bài báo Làm cho AI có ý nghĩa một lần nữa , các tác giả cũng thảo luận về sự khó khăn của nhiệm vụ dịch thuật (được cho là một vấn đề hoàn chỉnh của AI ). Họ cũng đề cập đến máy biến áp (một mô hình dịch máy hiện đại khác), đạt được kết quả khá kém (được đánh giá bằng cách sử dụng số liệu BLEU).

Để kết luận, dịch máy là một vấn đề khó khăn và các hệ thống dịch máy hiện tại chắc chắn không hoạt động tốt như một dịch giả chuyên nghiệp.


100 điểm BLEU không có nghĩa là bản dịch tiêu chuẩn vàng của con người, nó có nghĩa là nó phù hợp với bản dịch tham khảo chính xác. Vì thường có nhiều cách để dịch một câu, ngay cả bản dịch của con người thường không có 100 BLEU, nhưng giống như 50-60.
cần

@justhalf Đọc lại câu trả lời của tôi.
ngày

1
Cảm ơn đã trả lời, và xin lỗi nếu bình luận trước đó của tôi xuất hiện thô lỗ. Quan điểm của tôi trong nhận xét trước đây của tôi là không chính xác khi đưa ra ấn tượng rằng bản dịch của con người sẽ nhận được 100 điểm BLEU, điều mà câu trả lời hiện tại của bạn dường như làm được.
cần

100

5

Bạn đã hỏi khá nhiều câu hỏi, một số câu hỏi không thể trả lời dứt khoát. Để hiểu rõ hơn về chất lượng (và lịch sử của nó) các bản dịch máy tôi muốn nói đến Christopher Manning, 'tiêu chuẩn một câu' như được trình bày trong bài giảng của mình . Nó chứa một ví dụ từ tiếng Trung sang tiếng Anh được so sánh với đầu ra Google Dịch. Bản dịch chính xác cho ví dụ sẽ là:

Năm 1519, sáu trăm người Tây Ban Nha đã đổ bộ vào Mexico để chinh phục Đế chế Aztec với dân số vài triệu người. Họ đã mất 2/3 binh lính trong cuộc đụng độ đầu tiên.

Google Dịch đã trả lại các bản dịch sau.

2009 1519 600 Người Tây Ban Nha đổ bộ vào Mexico, hàng triệu người để chinh phục đế chế Aztec, hai phần ba binh sĩ đầu tiên chống lại sự mất mát của họ.

2011 1519 600 Người Tây Ban Nha đổ bộ vào Mexico, hàng triệu người để chinh phục đế chế Aztec, mất lính ban đầu, hai phần ba cuộc chạm trán của họ.

2013 1519 600 Người Tây Ban Nha đổ bộ vào Mexico để chinh phục đế chế Aztec, hàng trăm triệu người, cuộc đối đầu ban đầu của những người lính mất 2/3.

2015 1519 600 Người Tây Ban Nha đổ bộ vào Mexico, hàng triệu người để chinh phục đế chế Aztec, hai phần ba đầu tiên của sự mất mát của những người lính mà họ đụng độ.

2017 Năm 1519, 600 người Tây Ban Nha đổ bộ vào Mexico, để chinh phục hàng triệu người của đế chế Aztec, cuộc đối đầu đầu tiên họ đã giết chết 2/3.

Cho dù Google giữ lại hay 'che giấu' kết quả tốt nhất của họ: Tôi nghi ngờ điều đó. Có nhiều nhà nghiên cứu xuất sắc làm việc trong lĩnh vực xử lý ngôn ngữ tự nhiên (NLP). Nếu Google có "thành tựu lớn nhất" cho dịch thuật, các nhà nghiên cứu sẽ sớm tìm ra nó. (Tại sao Google sẽ che giấu 'thành tích lớn nhất' của họ bằng mọi cách? Họ dường như thấy được lợi ích của nguồn mở, xem Biến áp [1] hoặc BERT [2])

Lưu ý Để biết danh sách cập nhật các thuật toán tiên tiến trong NLP, hãy xem bảng xếp hạng SQuAD2.0 .

[1] Vaswani, Ashish, et al. "Chú ý là tất cả những gì bạn cần." Những tiến bộ trong hệ thống xử lý thông tin thần kinh. 2017.

[2] Devlin, Jacob, et al. "Bert: Đào tạo trước các máy biến áp hai chiều sâu để hiểu ngôn ngữ." bản in sẵn arXiv arXiv: 1810.04805 (2018).


Cảm ơn rất nhiều về liên kết đến "các nhà nghiên cứu được đền bù xứng đáng". Có sự bù trừ trong tâm trí luôn giúp hiểu mọi thứ tốt hơn (mặc dù tôi không biết bạn nghĩ gì khi thiết lập liên kết này).
Hans-Peter Stricker

Đối số cũng không phải là rất vững chắc. Đã xóa liên kết và cố gắng cải thiện đối số. Tôi đã đọc rất nhiều bài báo NLP và khá tự tin vào những phát hiện của mình, nhưng thật khó để tìm thấy sự hỗ trợ cho tranh luận.
RikH

Xin vui lòng cho tôi biết về những phát hiện của bạn (nếu bạn không phiền). Địa chỉ thư của tôi có thể được tìm thấy trên trang hồ sơ của tôi.
Hans-Peter Stricker

1
2019 :In 1519, 600 Spaniards landed in Mexico to conquer the Aztec empire of millions of people, and they first met two-thirds of their soldiers.
Dan M.

4

Nó thực sự phụ thuộc vào cặp ngôn ngữ và chủ đề của nội dung. Dịch sang / từ tiếng Anh sang bất kỳ ngôn ngữ nào khác thường được hỗ trợ tốt nhất. Dịch sang và từ các ngôn ngữ phổ biến hoạt động tốt hơn, ví dụ, dịch từ tiếng Anh sang tiếng Rumani là một bản dịch kém hơn tiếng Anh sang tiếng Nga. Nhưng dịch từ tiếng Anh sang tiếng Nga hoặc tiếng Rumani tốt hơn là dịch tiếng Nga sang tiếng Rumani. Và dịch tiếng Rumani sang tiếng Anh tốt hơn là dịch tiếng Anh sang tiếng Rumani.

Nhưng nếu bạn đã quen làm việc với các dịch giả và bạn đã quen với các ngôn ngữ, lỗi dịch thuật và chủ đề, thì thật dễ hiểu những gì đáng lẽ phải ở đó. Và, tại thời điểm đó, đôi khi việc đọc một thứ gì đó được dịch sang ngôn ngữ mẹ đẻ của bạn để quét nhanh hơn là đọc ngôn ngữ thứ hai dễ dàng hơn.

Các ngôn ngữ ít phổ biến hơn (đối với bản dịch không nhất thiết phải có số lượng người nói) gần với bản dịch nghĩa đen hơn một chút so với những gì cá nhân bạn sẽ làm khi sử dụng từ điển cho hai ngôn ngữ mà bạn không biết.


2

Tôi có sai không và bản dịch của Google vẫn có thể đọc được, hữu ích và hữu ích cho đa số người dùng?

Vâng, chúng có phần hữu ích và cho phép bạn dịch nhanh hơn.

Hay Google có lý do để giữ lại những thành tựu lớn nhất của mình (và không hiển thị cho người dùng những gì tốt nhất họ có thể hiển thị)?

Có lẽ, tôi không biết. Nếu bạn tìm kiếm thông tin, Google thực sự làm rất nhiều thứ ngu ngốc khủng khiếp, như học hỏi từ những gì người dùng nói trên internet, lấy dữ liệu không phù hợp làm bộ dữ liệu đầu vào đáng tin cậy.


2

Xin lỗi vì không viết bằng tiếng Anh. Vui lòng tìm bản dịch phù hợp tại đây:

Để cung cấp cho những người quan tâm ý tưởng về chất lượng của MT (DeepL), vui lòng xem ví dụ này từ một văn bản tôi đang làm việc sáng nay (6.300 từ, bắt đầu lúc 9 giờ sáng, giao hàng ngày hôm nay khoảng 1 giờ chiều và vẫn còn thời gian cho bài đăng này). Tôi đã làm việc với câu này (201 từ) khi tôi đăng bình luận của mình.

hoặc bất kỳ quy trình nào chạy hoặc được kích hoạt trong khi bạn chưa đăng nhập vào Trang web này hoặc điều đó sẽ can thiệp vào hoạt động đúng hoặc đặt tải không hợp lý lên cơ sở hạ tầng của Trang web này; hoặc (e) Sử dụng phần mềm, thiết bị thủ công hoặc tự động hoặc các quy trình khác để "thu thập dữ liệu", "cạo" hoặc "nhện" bất kỳ trang nào của Trang web này; hoặc (f) Biên dịch, kỹ sư đảo ngược hoặc cố gắng lấy mã nguồn của trang web này. "

DeepL trả về điều này:

Sie Versicotta, garantieren und verpflichten sich gegenüber ABC, dass Sie die nicht tun werden: dass Sie die nicht tun werden: (a) oder (b) Mitteilungen oder Aufforderungen, die dazu bestimmt sind oder sind, Passworter, Konten oder private Informationen von anderen Nutzern dieer Trang web zu erhalten, zu posten oder zu übertragen oder (c) die Sicherheit eines Computernetzwerks verletzen, Passworter oder Sicherheitsverschlüsselungscodes knacken, unales chết ausdrücklich verboten sind; oder (d) Mailliste, Listenserver oder jede andere Form von Auto-responder oder "Spam" auf dieer Website oder Prozese Trang web của Belastung der cơ sở hạ tầng cơ sở hạ tầng; oder (e) manuelle oder automatisierte Phần mềm, Geräte oder andere Prozese verwenden, um eine Seite dieer Trang web zu "crawlen", zu kratzen, zu spinnen oder zu spinnen; oder (f) dekompilieren, zurückzuentwickeln oder anderweitig zu Versuchen, den Quellcode dieer Trang web zu erhalten. die ausgeführt werden oder aktiviert werden, während Sie nicht auf dieer Trang web angemeldet sind, oder die anderweitig das ordnungsgemäße Funktionieren oder eine unangemessene Belastung oder (e) manuelle oder automatisierte Phần mềm, Geräte oder andere Prozese verwenden, um eine Seite dieer Trang web zu "crawlen", zu kratzen, zu spinnen oder zu spinnen; oder (f) dekompilieren, zurückzuentwickeln oder anderweitig zu Versuchen, den Quellcode dieer Trang web zu erhalten. die ausgeführt werden oder aktiviert werden, während Sie nicht auf dieer Trang web angemeldet sind, oder die anderweitig das ordnungsgemäße Funktionieren oder eine unangemessene Belastung oder (e) manuelle oder automatisierte Phần mềm, Geräte oder andere Prozese verwenden, um eine Seite dieer Trang web zu "crawlen", zu kratzen, zu spinnen oder zu spinnen; oder (f) dekompilieren, zurückzuentwickeln oder anderweitig zu Versuchen, den Quellcode dieer Trang web zu erhalten. zu kratzen, zu spinnen oder zu spinnen; oder (f) dekompilieren, zurückzuentwickeln oder anderweitig zu Versuchen, den Quellcode dieer Trang web zu erhalten. zu kratzen, zu spinnen oder zu spinnen; oder (f) dekompilieren, zurückzuentwickeln oder anderweitig zu Versuchen, den Quellcode dieer Trang web zu erhalten.

Tôi mất khoảng 5 đến 10 phút để điều chỉnh đoạn này.

Là một dịch giả, tôi biết rằng tôi không thể dựa vào bản dịch máy, nhưng tôi đã học được các chi tiết cụ thể và khả năng của các hệ thống khác nhau theo thời gian và tôi biết phải chú ý điều gì.

MT giúp tôi rất nhiều trong công việc của tôi.


2
Lưu ý rằng các văn bản pháp lý mang lại các bản dịch tự động tốt hơn, vì có rất nhiều văn bản đa ngôn ngữ trong lĩnh vực này.
Quora Feans

1

Đây sẽ không phải là một câu trả lời như một bình luận.

Chất lượng phụ thuộc vào một số điều, bao gồm (như Aaron đã nói ở trên) 1) cặp ngôn ngữ và 2) chủ đề, nhưng cũng có 3) chi và 4) kiểu của bản gốc và 5) số lượng văn bản song song bạn có để đào tạo hệ thống MT.

Để thiết lập giai đoạn, hầu như tất cả các MT ngày nay đều dựa trên các văn bản song song, đó là một văn bản bằng hai ngôn ngữ khác nhau, với một ngôn ngữ có thể là bản dịch của ngôn ngữ kia (hoặc cả hai đều là bản dịch của ngôn ngữ thứ ba); và có khả năng sử dụng từ điển (có lẽ được hỗ trợ bởi các quá trình hình thái) làm backoff khi các văn bản song song không chứa các từ cụ thể.

Hơn nữa, như những người khác đã nói, một hệ thống MT không có cách nào hiểu được các văn bản mà nó dịch; nó chỉ nhìn thấy các chuỗi ký tự, và các chuỗi từ được tạo thành từ các ký tự, và nó tìm kiếm các chuỗi và chuỗi tương tự trong các văn bản được dịch trước đó. (Ok, nó hơi phức tạp hơn thế, và đã có những nỗ lực để đạt được ngữ nghĩa trong các hệ thống tính toán, nhưng hiện tại, nó chủ yếu là các chuỗi.)

1) Ngôn ngữ khác nhau. Một số ngôn ngữ có rất nhiều hình thái, có nghĩa là chúng làm mọi việc với một từ duy nhất mà các ngôn ngữ khác làm với một vài từ. Một ví dụ đơn giản sẽ là tiếng Tây Ban Nha 'cantaremos' = tiếng Anh "chúng tôi sẽ hát". Và một ngôn ngữ có thể làm những việc mà ngôn ngữ kia thậm chí không bận tâm, như sự phân biệt không chính thức / chính thức (tu / ust) trong tiếng Tây Ban Nha, mà tiếng Anh không có tương đương. Hoặc một ngôn ngữ có thể làm những việc với hình thái mà ngôn ngữ khác làm với trật tự từ. Hoặc tập lệnh mà ngôn ngữ sử dụng có thể không đánh dấu ranh giới từ (tiếng Trung Quốc và một vài chữ khác). Hai ngôn ngữ càng khác nhau, hệ thống MT sẽ càng khó dịch giữa chúng. Các thí nghiệm đầu tiên trong MT thống kê được thực hiện giữa tiếng Pháp và tiếng Anh,

2) Chủ đề: Nếu bạn có các văn bản song song trong Kinh thánh (điều này đúng với gần như bất kỳ cặp ngôn ngữ viết nào) và bạn huấn luyện hệ thống MT của mình khỏi những ngôn ngữ đó, đừng hy vọng nó sẽ làm tốt các văn bản kỹ thuật. (Chà, dù sao thì Kinh thánh là một lượng văn bản tương đối nhỏ theo tiêu chuẩn đào tạo hệ thống MT, nhưng giả vờ :-).) Từ vựng của Kinh thánh rất khác so với các văn bản kỹ thuật, và tần số của các ngữ pháp khác nhau cũng vậy. công trình xây dựng. (Ngữ pháp về cơ bản là giống nhau, nhưng trong tiếng Anh, ví dụ, bạn nhận được nhiều giọng nói thụ động hơn và nhiều danh từ ghép trong các văn bản khoa học và kỹ thuật.)

3) Genera: Nếu văn bản song song của bạn là tất cả khai báo (như hướng dẫn sử dụng máy kéo, giả sử), cố gắng sử dụng hệ thống MT kết quả trên hộp thoại sẽ không mang lại cho bạn kết quả tốt.

4) Phong cách: Hãy nghĩ Hilary so với Donald; uyên bác so với phổ biến. Đào tạo về một người sẽ không có kết quả tốt về người khác. Tương tự, đào tạo hệ thống MT trên tiểu thuyết cấp người lớn và sử dụng nó trên sách thiếu nhi.

5) Cặp ngôn ngữ: Tiếng Anh có rất nhiều văn bản và cơ hội tìm thấy văn bản trong một số ngôn ngữ khác song song với một văn bản tiếng Anh nhất định cao hơn nhiều so với cơ hội tìm thấy các văn bản song song trong tiếng Nga và tiếng Igbo. (Điều đó nói rằng, có thể có ngoại lệ, như ngôn ngữ của Ấn Độ.) Là một khái quát chung, bạn càng có nhiều văn bản song song như vậy để đào tạo hệ thống MT, kết quả tốt hơn.

Tóm lại, ngôn ngữ rất phức tạp (đó là lý do tại sao tôi yêu nó - tôi là một nhà ngôn ngữ học). Vì vậy, không có gì ngạc nhiên khi các hệ thống MT không luôn hoạt động tốt.

BTW, dịch giả của con người cũng không phải lúc nào cũng làm tốt như vậy. Một hoặc hai thập kỷ trước, tôi đã nhận được các bản dịch tài liệu từ người dịch sang tiếng Anh, để được sử dụng làm tài liệu đào tạo cho các hệ thống MT. Một số bản dịch rất khó hiểu và trong một số trường hợp chúng tôi nhận được bản dịch từ hai (hoặc nhiều) người dịch, thật khó tin những người dịch đã đọc cùng một tài liệu.

Và cuối cùng, có (hầu như) không bao giờ chỉ một bản dịch chính xác; có nhiều cách dịch một đoạn văn, có thể tốt hơn hoặc ít hơn, tùy thuộc vào tính năng nào (tính chính xác về ngữ pháp, phong cách, tính nhất quán của cách sử dụng, ...) bạn muốn. Không có thước đo dễ dàng về "độ chính xác".


1

Đáng ngạc nhiên là tất cả các câu trả lời khác rất mơ hồ và cố gắng tiếp cận điều này từ dịch giả POV của con người. Hãy chuyển sang kỹ sư ML.

Khi tạo một công cụ dịch thuật, một trong những câu hỏi đầu tiên mà chúng ta nên xem xét là "Làm thế nào để chúng ta đo lường rằng công cụ của chúng ta hoạt động?" .

Đó thực chất là những gì OP đang yêu cầu.

Bây giờ đây không phải là một nhiệm vụ dễ dàng (một số câu trả lời khác giải thích tại sao). Có một Điều khoản Wikipedia đề cập đến các cách khác nhau để đánh giá kết quả dịch máy - cả điểm số của con người và tự động đều tồn tại (như BLEU , NIST , LEPOR ).

Với sự gia tăng của các kỹ thuật mạng thần kinh, những điểm số được cải thiện đáng kể.

Dịch thuật là một vấn đề phức tạp. Có rất nhiều điều có thể đi đúng (hoặc sai), và hệ thống dịch máy tính thường bỏ qua một số điều tinh tế, nổi bật đối với một người nói.

Tôi nghĩ rằng nếu chúng ta nghĩ về tương lai, có vài điều mà chúng ta có thể dựa vào:

  • Kỹ thuật của chúng tôi đang trở nên tốt hơn, được biết đến rộng rãi hơn và được thử nghiệm. Điều này sẽ cải thiện độ chính xác trong thời gian dài.
  • Chúng tôi đang phát triển các kỹ thuật mới có thể tính đến các biến tài khoản trước đây bị bỏ qua hoặc chỉ làm một công việc tốt hơn.
  • Nhiều mô hình dịch hiện tại thường được "tái sử dụng" để dịch các ngôn ngữ khác (ví dụ: thử dịch "JEDEN" từ tiếng Ba Lan sang tiếng Trung Quốc (truyền thống) bằng Google Translator - bạn sẽ kết thúc bằng "ONE", đây là bằng chứng chỉ ra thực tế là Google dịch tiếng Ba Lan sang tiếng Anh và sau đó là tiếng Anh sang tiếng Trung Quốc). Đây rõ ràng không phải là một cách tiếp cận tốt - bạn sẽ mất một số thông tin trong quy trình - nhưng đó là một cách vẫn sẽ hoạt động, vì vậy các công ty như Google sử dụng nó cho các ngôn ngữ mà họ không có đủ lực lượng lao động hoặc dữ liệu. Với thời gian, các mô hình chuyên biệt hơn sẽ xuất hiện, điều này sẽ cải thiện tình hình.
  • Ngoài ra, như điểm trước đã nêu, ngày càng nhiều dữ liệu sẽ chỉ giúp cải thiện bản dịch máy.

Tóm lại, vấn đề phức tạp này, mặc dù chưa được giải quyết, nhưng chắc chắn là một cách tốt và cho phép một số kết quả ấn tượng cho các cặp ngôn ngữ được nghiên cứu kỹ lưỡng.


"Đáng ngạc nhiên là tất cả các câu trả lời khác ...", không phải tất cả các câu trả lời khác. Tôi sẽ nói "Một số câu trả lời khác" hoặc "Hầu hết các câu trả lời khác".
ngày

0

"Hoặc Google có lý do để giữ lại thành tích của mình (và không hiển thị cho người dùng những gì tốt nhất họ có thể hiển thị)"

Nếu họ là như vậy, thì những gì họ đang giữ lại sẽ rất tuyệt vời . Google xuất bản rất nhiều bài báo mạnh mẽ trong Xử lý ngôn ngữ tự nhiên, bao gồm những bài báo đạt được kết quả hiện đại hoặc tạo ra những đột phá quan trọng về mặt khái niệm . Họ cũng đã phát hành các bộ dữ liệucông cụ rất hữu ích . Google là một trong số ít các công ty không chỉ sử dụng các nghiên cứu hiện tại mà còn đóng góp tích cực cho tài liệu.

Máy dịch chỉ là một vấn đề khó. Một dịch giả giỏi của con người cần phải thông thạo cả hai ngôn ngữ để thực hiện tốt công việc. Mỗi ngôn ngữ sẽ có thành ngữ riêng và ý nghĩa không theo nghĩa đen hoặc phụ thuộc vào ngữ cảnh. Chỉ làm việc từ một từ điển ngôn ngữ kép sẽ mang lại kết quả khủng khiếp (cho người hoặc máy tính), vì vậy chúng tôi cần đào tạo các mô hình của chúng tôi trên các ngôn ngữ hiện có tồn tại trong nhiều ngôn ngữ để tìm hiểu cách sử dụng các từ thực sự (cụm từ được biên dịch bằng tay bảng dịch có thể được sử dụng như các tính năng , chúng không thể là toàn bộ câu chuyện). Đối với một số cặp ngôn ngữ, ngôn ngữ song song rất phong phú (ví dụ: đối với các ngôn ngữ EU, chúng tôi có các thủ tục tố tụng hoàn chỉnh của Nghị viện châu Âu). Đối với các cặp khác, dữ liệu đào tạo là ít hơn. Và ngay cả khi chúng ta có dữ liệu đào tạo, sẽ tồn tại những từ và cụm từ ít được sử dụng mà không xuất hiện thường xuyên đủ để học.

Điều này từng là một vấn đề thậm chí còn lớn hơn, vì các từ đồng nghĩa rất khó để giải thích. Nếu dữ liệu huấn luyện của chúng tôi có câu "Con chó bắt bóng", nhưng không phải là "Con chó con bắt bóng", chúng tôi sẽ có xác suất thấp cho câu thứ hai. Thật vậy, làm mịn đáng kể sẽ là cần thiết để ngăn xác suất bằng không trong nhiều trường hợp như vậy.

Sự xuất hiện của các mô hình ngôn ngữ thần kinh trong khoảng 15 năm trở lại đây đã giúp đỡ rất nhiều cho vấn đề này, bằng cách cho phép các từ được ánh xạ tới một không gian ngữ nghĩa có giá trị thực trước khi tìm hiểu các kết nối giữa các từ. Điều này cho phép các mô hình được học trong đó các từ gần nhau về nghĩa cũng gần nhau trong không gian ngữ nghĩa và do đó, việc chuyển một từ cho từ đồng nghĩa của nó sẽ không ảnh hưởng lớn đến xác suất của câu có chứa. word2veclà một mô hình minh họa điều này rất tốt; nó cho thấy rằng bạn có thể, ví dụ, lấy vectơ ngữ nghĩa cho "vua", trừ vectơ cho "đàn ông", thêm vectơ cho "phụ nữ" và thấy rằng từ gần nhất với vectơ kết quả là "nữ hoàng". Khi nghiên cứu về các mô hình ngôn ngữ thần kinh bắt đầu một cách nghiêm túc, chúng tôi bắt đầu thấy sự lúng túng ngay lập tức và lớn (ví dụ như các mô hình bị nhầm lẫn bởi văn bản tự nhiên) và chúng tôi đang thấy sự gia tăng tương ứng về điểm số BLEU (tức là chất lượng dịch thuật) mô hình ngôn ngữ đang được tích hợp vào các hệ thống dịch máy.

Máy dịch vẫn là không tốt như bản dịch chất lượng con người, và hoàn toàn có thể sẽ không được tốt cho đến khi chúng vỡ hoàn toàn khôn AI. Nhưng các dịch giả giỏi của con người thì đắt tiền, trong khi tất cả mọi người có quyền truy cập Internet đều có sẵn các dịch giả máy. Câu hỏi không phải là liệu bản dịch của con người có tốt hơn không, mà là mức độ gần của máy đạt đến mức chất lượng đó. Khoảng cách đó đã được thu hẹp và đang tiếp tục thu hẹp.


Tôi không thích cách tiếp cận này - nhưng đó là vấn đề về sở thích và quan điểm. Làm mà không có bản dịch "học / hiểu / hiểu" chỉ vì "người dịch đắt tiền" khiến tôi cảm thấy buồn. Thế thì dịch là gì?
Hans-Peter Stricker

@ Hans-PeterStricker Dịch là về khả năng giao tiếp với những người mà bạn không chia sẻ ngôn ngữ chung. Dịch máy hiện tại đủ tốt để cho phép chúng tôi thực hiện điều đó một cách tốt, mặc dù các bản dịch kết quả thường không theo ngữ pháp hoặc âm thanh như người không bản ngữ. (tiếp tục ...)
Ray

Tùy thuộc vào ý của bạn là "học / hiểu / hiểu", chúng tôi có thể đã làm điều đó. Đó là những gì ánh xạ tới một vectơ ngữ nghĩa là; các từ được nhúng trong một không gian vectơ đại diện cho ý nghĩa cơ bản của chúng. Bài báo Sutskever mà tôi đã liên kết (dưới dạng "khái niệm") thực sự dịch bằng cách ánh xạ toàn bộ câu lên một vectơ ngữ nghĩa và sau đó chuyển vectơ đó thành một câu trong ngôn ngữ đích. Vì vậy, "sự hiểu biết" của một loại chắc chắn xảy ra ở đó. (tiếp tục ...)
Ray

Cũng tồn tại các mô hình học cú pháp cơ bản (nghĩa là cấu trúc câu) và đã có công việc tích hợp nó vào các mô hình thần kinh, mặc dù tại thời điểm này, các mô hình tìm hiểu những phần nào của câu mà chúng nên chú ý tại bất kỳ thời điểm nào để có hiệu quả hơn trong việc xử lý loại điều đó hơn các mô hình cú pháp rõ ràng. (tiếp tục ...)
Ray

Nếu bạn không nghĩ rằng bất kỳ loại "hiểu" nào này được tính là Sự hiểu biết thực sự, thì cái gì sẽ được tính khác ngoài một AI vượt qua Bài kiểm tra Turing, tức là một cách hoàn toàn thông minh? Xin lưu ý rằng tôi chưa bao giờ nói rằng chúng ta không thể tạo ra một AI hoàn toàn thông minh (tôi không thể nói sẽ mất bao lâu; đó không phải là một phần của lĩnh vực này. Nhưng tôi có chút nghi ngờ rằng cuối cùng chúng ta sẽ đến đó). Nhưng các mô hình tôi mô tả ở đây là những gì chúng ta đang sử dụng hiện nay , và họ làm việc khá tốt tại cho phép mọi người để giao tiếp. Nghiên cứu về AI là tất cả về việc có được các phiên bản "đủ tốt" liên tiếp
Ray
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.