Có phải 'Eugene Goostman' đã thực sự vượt qua bài kiểm tra Turing?

18

Người ta nói rằng 'Eugene Goostman', một chương trình máy tính được phát triển để mô phỏng một cậu bé 13 tuổi, đã thuyết phục được 33 phần trăm các thẩm phán rằng đó là con người, và do đó đã vượt qua Bài kiểm tra Turing.

Chương trình máy tính, hay còn gọi là chatbot, đã giả vờ là một cậu bé 13 tuổi người Ukraine mà tiếng Anh là ngôn ngữ thứ hai - thực sự là một thứ rất khác.

Đối với tôi, Eugene nghe giống hệt một chatbot tầm thường nên: lặp đi lặp lại, vô nghĩa và xả rác với những người không theo trình tự. Tôi không biết làm thế nào nó thuyết phục các thẩm phán (có vẻ không chuyên nghiệp).

Nhiều người đã chỉ trích Eugene như Giáo sư Stevan Harnad, người nói rằng "Điều đó thật vô nghĩa" và "Chúng tôi chưa vượt qua bài kiểm tra Turing. Chúng tôi thậm chí không gần gũi."

Ý kiến khác nhau, nhưng tôi thực sự muốn biết nếu nó chính thức vượt qua bài kiểm tra?

Nó cũng đang được nói rằng:

Hai giải thưởng một lần duy nhất chưa bao giờ được trao. 25K được cung cấp cho chatterbot đầu tiên mà các thẩm phán không thể phân biệt được với một con người thực sự và điều đó có thể thuyết phục các thẩm phán rằng con người là chương trình máy tính. 100.000 đô la là phần thưởng cho người trò chuyện đầu tiên mà các thẩm phán không thể phân biệt với người thật trong bài kiểm tra Turing bao gồm giải mã và hiểu văn bản, hình ảnh và đầu vào thính giác. Một khi điều này đạt được, cuộc thi hàng năm sẽ kết thúc.

Điều đó có nghĩa là Eugene đã giành được 25.000 đô la?

— George Chalhoub
nguồn

2

Điều rất quan trọng là các thẩm phán biết họ đang ở trong tình huống.

— Thorbjørn Ravn Andersen

3

2/3 các thẩm phán nghĩ rằng 'bot này không phải là con người. Đối với tôi mà nói rằng bản chất nhân tạo của sự tương tác này là rõ ràng hơn so với phần lớn các thẩm phán. Tôi gọi đây là một thất bại rõ ràng. (Và ngay cả khi "Eugene" "thắng" - làm thế nào một người nhân tạo thu được tiền thật? BitCoin? :-)

— Bob Jarvis - Tái lập lại

Bạn có thể cung cấp một cuộc trò chuyện mẫu? Tôi tương tác với người Ukraine hàng ngày và cách họ nói tiếng Anh rất dễ nhận ra.

— Stephan bijzitter

18

Không có "thử nghiệm Turing chính thức" nên không có khái niệm "chính thức vượt qua [thử nghiệm] thử nghiệm". Turing đã mô tả một phương pháp mà người ta có thể sử dụng để đánh giá trí tuệ nhân tạo. Các nhà tổ chức của sự kiện mà Eugene Goostman giành được đã thực hiện phương pháp đó theo một cách riêng và chương trình đã thỏa mãn các tiêu chí mà ban tổ chức đã chọn. Theo nghĩa đó, nó đã vượt qua bài kiểm tra.

Vì không có "thử nghiệm Turing chính thức", nó có thể thích hợp hơn để nói rằng Eugene Goostman thông qua một bài kiểm tra Turing hoặc thậm chí thông qua một bài kiểm tra Turing-phong cách. Nó không chắc rằng các phương tiện truyền thông sẽ nhặt trên tinh tế như vậy, đặc biệt là cho sự nổi tiếng của Turing và ý tưởng của " các bài kiểm tra Turing" trong lương tâm công cộng.

— David Richerby
nguồn

3

Bên cạnh đó, Eugene Goostman sẽ trở thành rác rưởi trong trò chơi bắt chước ban đầu của Turing ;-)

— Steve Jessop

9

Tôi nghĩ rằng các giải thưởng mà bạn đề cập đến là Giải thưởng Loebner . Theo trang Wikipedia (xem liên kết trước), người chiến thắng năm 2014 là 'Bông hồng' của Bruce Wilcox. Chương trình đó đã không giành được một trong những giải thưởng chỉ có một lần, nhưng đã nhận được 4.000 đô la tiền thưởng. 'Eugene Goostman' đã thi đấu năm 2005 và 2008, đứng thứ hai cả hai lần.

Cuộc thi 'Eugene Goostman' đã được tổ chức bởi Kevin Warwick thuộc Đại học Coventry để đánh dấu 60 năm kể từ khi Alan Turing đi qua. Tôi không biết về bất kỳ khoản tiền thưởng nào.

Hãy xem Ray Kurzweil tham gia cả cuộc thi và chương trình được đề cập. Trích đoạn:

Giáo sư Warwick tuyên bố rằng bài kiểm tra này không bị hạn chế. Tuy nhiên, việc chatbot tự nhận là một đứa trẻ 13 tuổi và một người mà tiếng Anh không phải là ngôn ngữ đầu tiên, thực sự là một hạn chế. Hơn nữa, các tương tác được báo cáo giới hạn trong năm phút mỗi lần. Có khả năng cao đánh lừa các thẩm phán ngây thơ trong một khoảng thời gian ngắn như vậy.

Tôi đã nói chuyện với chatbot Eugene Goostman và không ấn tượng lắm. Eugene không theo dõi cuộc trò chuyện, lặp đi lặp lại từng từ và thường trả lời bằng chatbot không theo trình tự điển hình.

Tôi cũng thấy đây là một bình luận hay: WIRED - Máy tính đó thực sự có điểm F trong bài kiểm tra Turing

— Eric Hughes
nguồn

1

Tôi cũng thích bit Wired, đặc biệt là "Trong một cuộc thi năm 1991, một bot có tên PC Therapist đã có thể khiến năm trong số 10 giám khảo tin rằng đó là con người." Cũng liên quan đến ngưỡng "đặc biệt"> 30% đánh lừa: "Vì vậy, cha đẻ của bài kiểm tra Turing đã không sử dụng điều này như một ngưỡng cho trí thông minh, anh ta chỉ đơn giản nêu ra dự đoán của mình về nơi mà anh ta nghĩ rằng máy tính sẽ là năm thập kỷ trong tương lai. "

— Fizz

10

Tóm lại: Bot bot "đã vượt qua" bài kiểm tra này không phải bằng cách mô phỏng trí thông minh của con người, mà bằng cách mô phỏng sự ngu ngốc của con người.

— duskwuff 24/2/2015

2

Thêm một liên kết Wikipedia để có thêm chiều sâu về Thử nghiệm Turing "gốc" . Có nhiều thử nghiệm gọi là "Thử nghiệm Turing". Wikipedia đề cập đến "ít nhất 3 phiên bản chính". Bài kiểm tra được Eugeene vượt qua không phải là một trong số 3. Bài kiểm tra do Eugeene vượt qua không phải do Alan Turing nghĩ ra, nhưng đó là bài kiểm tra có tên là bài kiểm tra Turing, lấy cảm hứng từ Alan Turing và Eugeene đã vượt qua.

Phần đề cập đến ít nhất 3 phiên bản chính của thử nghiệm Turing:

Saul Traiger lập luận rằng có ít nhất ba phiên bản chính của bài kiểm tra Turing, hai trong số đó được cung cấp trong "Máy tính và trí thông minh" và một phiên bản mà ông mô tả là "Phiên dịch chuẩn". Mặc dù có một số tranh luận liên quan đến việc "Phiên dịch tiêu chuẩn" được mô tả bởi Turing hay, thay vào đó, dựa trên việc đọc sai bài báo của ông, ba phiên bản này không được coi là tương đương, và điểm mạnh và điểm yếu của chúng là khác biệt.

Phiên bản 1

Trò chơi ban đầu của Turing mô tả một trò chơi tiệc tùng đơn giản có sự tham gia của ba người chơi. Người chơi A là một người đàn ông, người chơi B là một người phụ nữ và người chơi C (người đóng vai trò của người thẩm vấn) là một trong hai giới tính. Trong Trò chơi Bắt chước, người chơi C không thể thấy người chơi A hoặc người chơi B và chỉ có thể giao tiếp với họ thông qua ghi chú bằng văn bản. Bằng cách đặt câu hỏi của người chơi A và người chơi B, người chơi C cố gắng xác định ai trong hai người là đàn ông và ai là phụ nữ. Vai trò của Người chơi A là lừa người thẩm vấn đưa ra quyết định sai, trong khi người chơi B cố gắng hỗ trợ người thẩm vấn đưa ra quyết định đúng.

Phiên bản 2

Phiên bản thứ hai xuất hiện sau đó trong bài báo năm 1950 của Turing. Tương tự như Thử nghiệm trò chơi giả ban đầu, vai trò của người chơi A được thực hiện bởi máy tính. Tuy nhiên, vai trò của người chơi B được thực hiện bởi một người đàn ông chứ không phải một người phụ nữ. [...] Trong phiên bản này, cả người chơi A (máy tính) và người chơi B đều cố lừa người thẩm vấn đưa ra quyết định không chính xác.

Phiên bản 3

Hiểu biết chung cho rằng mục đích của Thử nghiệm Turing không đặc biệt là xác định liệu một máy tính có thể đánh lừa người thẩm vấn hay không tin rằng đó là con người, mà là liệu máy tính có thể bắt chước con người hay không. Mặc dù có một số tranh cãi về việc giải thích này có phải do Turing - Sterrett tin rằng đó là và do đó kết hợp phiên bản thứ hai với phiên bản này, trong khi những người khác, như Traiger, thì không - điều này vẫn dẫn đến những gì có thể được xem là " giải thích tiêu chuẩn. " Trong phiên bản này, người chơi A là một máy tính và người chơi B là một người thuộc giới tính. Vai trò của người thẩm vấn không phải là xác định ai là nam và nữ là ai, mà là máy tính và ai là con người. Vấn đề cơ bản với việc giải thích tiêu chuẩn là người thẩm vấn không thể phân biệt được người phản ứng nào là con người và ai là máy móc. Có những vấn đề về thời lượng, nhưng việc giải thích tiêu chuẩn thường coi giới hạn này là điều gì đó hợp lý.

Ngược lại, bài kiểm tra được thông qua bởi Eugeene có các thẩm phán con người trò chuyện với một chatbot trong 5 phút, sau đó họ phải quyết định xem đó có phải là bot hay không.

— Peter - Unban Robert Harvey
nguồn

0

Vâng, nó đã thắng "một" Thử nghiệm Turing theo mô tả ban đầu của Alan Turing càng sát càng tốt.
Tuy nhiên, đây không phải là phiên bản tiền thưởng trị giá 25000 đô la mà là Giải thưởng Loebner, có thông số kỹ thuật khác với mô tả của Alan Turing.
Quan trọng hơn, Alan Turing không bao giờ có nghĩa đây là một thử nghiệm chính hãng ngay từ đầu , vì vậy kết quả không phải là bằng chứng về trí thông minh, nếu đó là điều bạn thực sự muốn biết.

— Don Patrick
nguồn