Yêu cầu cụ thể của Turing Test


9

Các yêu cầu cụ thể của Turing Test là gì?

  • Những yêu cầu nào nếu bất kỳ người đánh giá phải đáp ứng để có đủ điều kiện để đưa ra thử nghiệm?
  • Phải luôn có hai người tham gia cuộc trò chuyện (một người và một máy tính) hoặc có thể có nhiều hơn?
  • Các xét nghiệm giả dược (nơi thực sự không có máy tính liên quan) được phép hay khuyến khích?
  • Có thể có nhiều người đánh giá? Nếu vậy, quyết định cần phải được nhất trí giữa tất cả các nhà đánh giá để máy có thể vượt qua bài kiểm tra?

Câu trả lời:


9

"Thử nghiệm Turing" thường được hiểu là một phiên bản cập nhật của Trò chơi Bắt chước Alan Turing được đề xuất trong bài báo cùng tên năm 1951 của ông. Một phiên bản ban đầu có một con người (nam hoặc nữ) và một máy tính, và một thẩm phán phải quyết định đó là cái gì, và họ thuộc giới tính nào nếu là con người. Nếu họ đúng dưới 50% thì máy tính được coi là "thông minh".

Phiên bản được chấp nhận chung hiện tại chỉ cần một thí sinh và một thẩm phán để quyết định xem đó là con người hay máy móc. Vì vậy, có, đôi khi đây sẽ là một giả dược, một cách hiệu quả, nếu chúng ta coi một con người là một giả dược.

Câu hỏi đầu tiên và thứ tư của bạn có liên quan - và không có hướng dẫn nghiêm ngặt. Nếu máy tính có thể đánh lừa số lượng thẩm phán lớn hơn thì tất nhiên nó sẽ được coi là một AI tốt hơn.

Đại học Toronto có phần hợp lệ trong bài báo này về Turing , bao gồm một liên kết đến bình luận của Jason Hutchens về lý do tại sao bài kiểm tra Turing có thể không liên quan (con người cũng có thể thất bại) và Giải thưởng Loebner , một giải thích chính thức về Turing Kiểm tra .


2

Thực sự có hai câu hỏi ở đây, mà tôi có thể thấy. Một là "các yêu cầu cụ thể của bài kiểm tra Turing ban đầu, như chính Turing đã nêu là gì?" Khác là "Các yêu cầu cụ thể của một thử nghiệm Turing hiện đại nên là gì?" Mọi thứ đã tiến triển rất nhiều kể từ ngày Turing và tôi nghĩ thật hợp lý khi chúng tôi xem xét việc mở rộng / sửa đổi thử nghiệm của mình để phản ánh sự hiểu biết hiện tại của chúng tôi.

Câu trả lời cho câu hỏi đầu tiên đủ dễ để tra cứu, vì vậy tôi nghĩ rằng câu hỏi thú vị là câu hỏi thứ hai. Có gì nên xét nghiệm để xác định cái nhìn thông minh như thế nào? Với ý nghĩ đó, tôi nghĩ rằng câu trả lời cho cả bốn câu hỏi mà OP đặt ra là "nó phụ thuộc". Tôi không nghĩ có sự đồng thuận phổ quát về cách cấu trúc một thử nghiệm Turing hoàn hảo, vì vậy một người thử nghiệm nhất định thực sự tự do thiết lập mọi thứ theo ý muốn của anh ấy / cô ấy.

Tất nhiên, tất cả, dựa trên giả định rằng thử nghiệm Turing hoặc thử nghiệm giống như Turing Test thực sự có giá trị. Đó không nhất thiết là một cho trước. Hãy xem xét, ở một mức độ nào đó, những gì chúng ta đang nói đến là thiết kế một AI với khả năng lừa đảo đặc biệt! Nghĩa là, giả sử người hỏi được phép đơn giản hỏi "bạn có phải là con người không", thì chúng ta phải cho rằng AI có nghĩa vụ phải nói dối nếu muốn vượt qua bài kiểm tra. Vì vậy, người ta có thể hỏi đúng, liệu thiết kế một hệ thống để thực sự giỏi nói dối, một cách tiếp cận có giá trị với AI?


0

Nếu bạn muốn hiểu thuyết tương đối, hãy đọc Einstein 1,2 , không phải là một cuốn sách về thuyết tương đối được tác giả bởi một giáo sư nghĩ rằng ông ấy đã hiểu. Nếu bạn muốn hiểu bài kiểm tra trí thông minh của Alan Turing trong bối cảnh hộp thoại của con người, hãy đọc Turing. 3 Giải thích có thể tồi tệ hơn vô giá trị. Họ thường gây hiểu lầm. Nếu các nguyên tắc có vẻ quá dày, hãy đọc lại cho đến khi bạn nhận được nó.

Trong trường hợp thử nghiệm trí thông minh của Turing trong bối cảnh đối thoại của con người, để hiểu đầy đủ về nó, nền tảng sau đây được giả định khi Turing viết, nếu bạn đọc bài viết năm 1950 của mình, sẽ trở nên rõ ràng.

  • Định lý tính hoàn chỉnh của Turing phản ứng thế nào với định lý bất toàn thứ hai của Kurt Gödel
  • Chiến lược của một bài kiểm tra có kiểm soát
  • Sự khác biệt giữa (a) nghe và nói và (b) nghe và trả lời một cách dè dặt - Điều này đặc biệt thích hợp ngày nay bởi vì các chat-bot làm (a) và có thể cách xa từ 5 đến 500 năm so với (b). Để đạt được (c) thấu hiểu sâu sắc và đáp ứng với cảm hứng, các nhà nghiên cứu AI phải vượt ra ngoài mô hình hóa tâm trí con người và tiếp cận thách thức mô hình hóa tâm trí của những người như Gôdel, Einstein và Turing. Cho dù điều đó sẽ xảy ra vẫn chưa được tiết lộ.

Các yêu cầu cụ thể của Trò chơi Bắt chước, phụ đề của Alan Turing bên trên mô tả về thử nghiệm suy nghĩ của anh ta, là một vấn đề kỷ lục.

Yêu cầu cụ thể [Trích từ bài viết thực tế]

[Trò chơi bắt chước] được chơi với ba người, một người đàn ông (A), một người phụ nữ (B) và một người thẩm vấn (C) có thể là một trong hai giới tính. Người thẩm vấn ở trong một căn phòng cách xa hai người kia. Mục tiêu của trò chơi cho người thẩm vấn là xác định ai trong hai người kia là đàn ông và ai là phụ nữ. Anh ta biết họ bằng nhãn X và Y, và vào cuối trò chơi, anh ta nói "X là A và Y là B" hoặc "X là B và Y là A." Người thẩm vấn được phép đặt câu hỏi cho A và B, do đó:

C: X xin vui lòng cho tôi biết chiều dài tóc của anh ấy hoặc cô ấy?

Bây giờ giả sử X thực sự là A, thì A phải trả lời. Đó là đối tượng của A trong trò chơi để thử và khiến C xác định sai. Câu trả lời của anh ấy có thể là:

"Tóc của tôi bị xơ, và những sợi dài nhất dài khoảng chín inch."

Để các âm của giọng nói có thể không giúp người thẩm vấn, các câu trả lời nên được viết, hoặc tốt hơn là, đánh máy. Sự sắp xếp lý tưởng là có một teleprinter giao tiếp giữa hai phòng. Ngoài ra, câu hỏi và câu trả lời có thể được lặp lại bởi một trung gian. Mục tiêu của trò chơi dành cho người chơi thứ ba (B) là giúp người thẩm vấn.

Chiến lược tốt nhất cho cô ấy có lẽ là đưa ra câu trả lời trung thực. Cô ấy có thể thêm những điều như "Tôi là phụ nữ, đừng nghe anh ta!" với câu trả lời của cô, nhưng sẽ chẳng ích gì khi người đàn ông có thể đưa ra nhận xét tương tự.

Bây giờ chúng tôi đặt câu hỏi, "Điều gì sẽ xảy ra khi một cỗ máy chiếm phần A trong trò chơi này?" Người thẩm vấn sẽ quyết định sai thường xuyên khi trò chơi được chơi như thế này khi anh ta chơi trò chơi giữa một người đàn ông và một người phụ nữ? Những câu hỏi này thay thế cho bản gốc của chúng tôi, "Máy móc có thể nghĩ?"

Đã có hàng ngàn bài phê bình về cả thuyết tương đối của Einstein và bài kiểm tra của Turing, không bài nào trong số đó làm tăng thêm giá trị. Nghiên cứu suy nghĩ của những người đóng góp lớn thông qua lời nói của chính họ và tất cả những từ chối tiếp theo sẽ thú vị chủ yếu ở sự thiếu tuyệt vời của nó.

Câu hỏi phụ trong chủ đề này

Những yêu cầu nào nếu bất kỳ người đánh giá phải đáp ứng để có đủ điều kiện để đưa ra thử nghiệm?

Người thẩm vấn (C) không phải là người đánh giá. Đánh giá sẽ là một nỗ lực để trở thành khách quan, tuy nhiên tiền đề của thí nghiệm tư tưởng của Turing là người thẩm vấn cung cấp cho cô ấy hoặc phán đoán chủ quan của anh ấy. Từ quan điểm thống kê, người thẩm vấn nên được chọn ngẫu nhiên từ dân số trên thế giới có chung ngôn ngữ nói với (A) và (B).

Phải luôn có hai người tham gia cuộc trò chuyện (một người và một máy tính) hoặc có thể có nhiều hơn?

Phải có chính xác hai để phù hợp với kịch bản được mô tả bởi Alan Turing. (Xem bên dưới để biết thêm chi tiết.)

Các xét nghiệm giả dược (nơi thực sự không có máy tính liên quan) được phép hay khuyến khích?

Người ta có thể kiểm tra tất cả các loại, và các nhà nghiên cứu, tuy nhiên, điều đó sẽ nằm ngoài phạm vi thử nghiệm tư tưởng của Turing. 4

Có thể có nhiều người đánh giá? Nếu vậy, quyết định cần phải được nhất trí giữa tất cả các nhà đánh giá để máy có thể vượt qua bài kiểm tra?

Những gì sẽ tiết lộ nhiều thông tin nhất cho những người tài trợ cho Trò chơi Bắt chước thực tế sẽ là một thử nghiệm ngẫu nhiên mù đôi trong đó (A), (B) và (C) được lấy ngẫu nhiên từ một mẫu của những người đàn ông, phụ nữ hoặc phần mềm đó các hệ thống thuộc loại thử nghiệm có thể giao tiếp bằng ngôn ngữ chung và thử nghiệm sẽ được chạy nhiều lần với các lựa chọn ngẫu nhiên từ các mẫu.

Sự nhất trí, đánh giá, độ phức tạp bổ sung và giao tiếp khác với thử nghiệm được chỉ định bởi thử nghiệm sẽ chỉ làm nản lòng nguyên nhân, nếu một người dính vào ý định ban đầu của Turing liên quan đến câu hỏi, "Máy tính có nghĩ được không?"

Quan điểm khác về trí thông minh

Turing, cũng như René Descartes, người đã tuyên bố rằng máy móc sẽ không bao giờ vượt qua một phiên bản ít kiểm soát hơn của Trò chơi giả của Turing, đã nhìn thấy trí thông minh qua lăng kính của hộp thoại. Những người khác đã xem xét các loại hộp thoại và bối cảnh khác ngoài hộp thoại. Tôi đã giải quyết điều này trong một câu hỏi khác:

Một bộ não có thể thông minh mà không cần một cơ thể?

Tài liệu tham khảo và chú thích

[1] Thuyết tương đối: Lý thuyết đặc biệt và tổng quát của Albert Einstein, 1916

[2] Nguyên lý tương đối của Albert Einstein và Francis A. Davis, 1923

[3] AM Turing (1950) Máy tính và trí thông minh. Tâm 49: 433-460. https://www.csee.umbc.edu/cifts/471/ con / turing.pdf

[4] Bài báo năm 1950 của Turing không khuyến nghị thử nghiệm suy nghĩ của ông nên được thể hiện và sử dụng để xác nhận thương mại các hệ thống AI trong tương lai. Tuy nhiên, Alan Turing quan tâm đến tính toán thực tế tại một thời điểm cụ thể trong sự nghiệp. Đó là khi phát xít Đức tràn ngập nước Pháp, đang nghiền nát quê hương của anh ta từ trên không, và đã đánh chìm một phần đáng kể của Hải quân Anh từ bên dưới, với sự trợ giúp của mật mã Enigma.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.