Thử nghiệm Turing, hay bất kỳ biến thể nào của nó, là thử nghiệm đáng tin cậy về trí tuệ nhân tạo?


35

Các Phép thử Turing là thử nghiệm đầu tiên của trí tuệ nhân tạo và bây giờ là một chút lỗi thời. Các Tổng Phép thử Turing nhằm mục đích trở thành một thử nghiệm hiện đại hơn mà đòi hỏi một hệ thống phức tạp hơn nhiều. Những kỹ thuật nào chúng ta có thể sử dụng để xác định trí thông minh nhân tạo (AI yếu) và trí thông minh chung nhân tạo (AI mạnh)?


6
Chắc chắn đòi hỏi một cách tiếp cận thống kê với một số người tham gia. Tôi đã gặp một số người sẽ không vượt qua Bài kiểm tra Turing.
SF.

1
Nó phụ thuộc vào những gì bạn định nghĩa thông minh là.
baranskistad

Câu trả lời:


16

Điểm hùng biện của Thử nghiệm Turing là nó đặt 'thử nghiệm' cho 'nhân loại' vào kết quả có thể quan sát được , thay vì trong các thành phần bên trong . Nếu bạn cư xử giống nhau khi tương tác với AI như bạn làm với một người, làm sao bạn có thể biết sự khác biệt giữa họ?

Nhưng điều đó không có nghĩa là nó đáng tin cậy, bởi vì trí thông minh có nhiều thành phần khác nhau và có nhiều loại nhiệm vụ trí tuệ. Xét nghiệm Turing, ở một số khía cạnh, là về phản ứng của mọi người đối với hành vi, điều này hoàn toàn không đáng tin cậy - hãy nhớ rằng nhiều người nghĩ ELIZA , một chatbot rất đơn giản, là một người lắng nghe xuất sắc và có cảm xúc sâu sắc rất nhanh. Nó gợi nhớ đến quảng cáo của Ikea về việc ném ra một chiếc đèn , trong đó sự gắn kết cảm xúc đến từ người xem (và âm nhạc), chứ không phải từ chiếc đèn.

Các thử nghiệm Turing cho các hoạt động kinh tế cụ thể thực tế thú vị hơn nhiều - nếu người ta có thể viết một AI thay thế một tài xế Uber, chẳng hạn, điều gì sẽ ngụ ý rõ ràng hơn nhiều so với việc ai đó có thể tạo một chatbot trò chuyện.


10

Vấn đề của Turing Test là nó kiểm tra khả năng của máy móc giống với con người. Không nhất thiết mọi hình thức AI phải giống với con người. Điều này làm cho Turing Test kém tin cậy. Tuy nhiên, nó vẫn hữu ích vì nó là một thử nghiệm thực tế. Một điều đáng chú ý là có một giải thưởng để vượt qua hoặc đến gần nhất để vượt qua Bài kiểm tra Turing, Giải thưởng Loebner .

Định nghĩa tác nhân thông minh của trí thông minh nói rằng một tác nhân là thông minh nếu nó hành động như vậy để tối đa hóa giá trị mong đợi của thước đo hiệu suất dựa trên kinh nghiệm và kiến ​​thức trong quá khứ. (diễn giải từ Wikipedia ). Định nghĩa này được sử dụng thường xuyên hơn và không phụ thuộc vào khả năng giống với con người. Tuy nhiên, khó hơn để kiểm tra điều này.


7

Thử nghiệm Turing cổ điển chắc chắn có những hạn chế. Bởi vì tôi chưa thấy nó được đề cập ở đây, tôi sẽ đề nghị bạn đọc về Phòng Trung Quốc , đây là một trong những lý do thường được trích dẫn nhất tại sao Thử nghiệm Turing thực sự không xác định được 'ý thức' thực sự. Tuy nhiên, tôi cũng lưu ý rằng bản thân Turing, trong bài báo gốc đề xuất Thử nghiệm Turing , đã thừa nhận rõ ràng rằng bản thân thử nghiệm không phải là một thử nghiệm để phát hiện ý thức :

Tôi đề nghị xem xét câu hỏi, "Máy móc có thể nghĩ không?" Điều này nên bắt đầu bằng các định nghĩa về ý nghĩa của thuật ngữ "máy" và "suy nghĩ". Các định nghĩa có thể được đóng khung để phản ánh càng nhiều càng tốt việc sử dụng các từ thông thường, nhưng thái độ này là nguy hiểm, Nếu ý nghĩa của các từ "máy" và "suy nghĩ" được tìm thấy bằng cách kiểm tra cách chúng được sử dụng phổ biến thật khó để thoát khỏi kết luận rằng ý nghĩa và câu trả lời cho câu hỏi "Máy móc có thể nghĩ được không?" sẽ được tìm kiếm trong một cuộc khảo sát thống kê như cuộc thăm dò của Gallup. Nhưng điều này là vô lý. Thay vì cố gắng định nghĩa như vậy, tôi sẽ thay thế câu hỏi bằng một câu hỏi khác, có liên quan chặt chẽ với nó và được diễn đạt bằng những từ tương đối rõ ràng.

Hình thức mới của vấn đề có thể được mô tả theo thuật ngữ của một trò chơi mà chúng tôi gọi là "trò chơi bắt chước".

Trò chơi bắt chước này là thử nghiệm mà ngày nay chúng ta biết (và cũng là nguồn cảm hứng cho tên của một bộ phim truyện gần đây có sự tham gia của Benedict Cumberbatch và Keira Knightley).


1
Câu trả lời chính xác. Tôi cũng chia sẻ ý kiến ​​về việc chuyển từ "Trò chơi bắt chước" sang "Thử nghiệm Turing" đã dẫn đến một số hiểu lầm sâu sắc về sự phân nhánh. (Phim khiêu dâm vượt qua Bài kiểm tra Turing mọi lúc;)
DukeZhou

5

Có rất nhiều định nghĩa về Trí tuệ nhân tạo ngoài tự nhiên. Tất cả các định nghĩa này là một phần của một (hoặc nhiều) các khu vực. Có bốn miền chính, và hình ảnh dưới đây sẽ làm sáng tỏ điều này.

nhập mô tả hình ảnh ở đây



Turing Test xoay quanh phía bên trái của cardinality, chủ yếu liên quan đến cách con người suy nghĩ hoặc hành động. Nhưng, chúng tôi biết rằng đây không chỉ là tất cả. Turing Test không có nhiều điều để nói về những gì AI nói chung.
Turing Test, như các tiểu bang Wikipedia, được tạo ra để kiểm tra các máy thể hiện hành vi tương đương hoặc không thể phân biệt với hành vi của con người. Trí tuệ nhân tạo là nhiều hơn những gì con người có thể làm hoặc cách họ hành động. Có nhiều hành vi của con người được coi là không thông minh và đôi khi cũng vô nhân đạo.
Đối số phòng Trung Quốc tập trung vào một cái gì đó rất quan trọng khi nói đến "Ý thức v / s Mô phỏng ý thức". John Searle lập luận rằng có thể một cỗ máy (hoặc con người) có thể tuân theo một số lượng lớn các quy tắc (thuật toán) được xác định trước, để hoàn thành nhiệm vụ, mà không cần suy nghĩ hay sở hữu tâm trí. AI yếu rất giỏi trong việc mô phỏng khả năng hiểu nhưng, không thực sự hiểu những gì chúng đang làm. Họ không thể hiện "Tự giác" và không thể hiện bản thân về bản thân. "Tôi muốn rằng v / s tôi biết tôi muốn điều đó" là hai điều khác nhau.

Như Lý thuyết về Tâm trí nói rằng một AI tốt không nên chỉ hình thành đại diện cho thế giới mà nó đang hoạt động, mà còn về các tác nhân và thực thể khác trên thế giới. Hai khái niệm về nhận thức bản thân và lý thuyết về tâm trí vẽ nên một ranh giới mỏng manh giữa AI yếu và mạnh.

Khi nói đến Thử nghiệm Turing, nó thất bại trên nhiều lý do và Total Turing Test cũng vậy, nó thêm một lớp nữa vào thử nghiệm. Hầu hết các nhà nghiên cứu tin rằng Turing Test chỉ là một sự phân tâm khỏi mục tiêu chính, một cái gì đó cản trở họ khỏi công việc hiệu quả. Hãy xem xét điều này, giả sử bạn hỏi một bài toán số học khó để phân biệt giữa người và máy. Nếu máy muốn giả vờ đó là con người thì nó sẽ nói dối. Đây không phải là những gì chúng ta muốn. Thực hiện bài kiểm tra Turing đặt giới hạn trên cho AI có thể được tạo. Ngoài ra làm cho AI hành động và hành xử như con người không phải là một ý tưởng rất tốt. Con người không giỏi trong việc đưa ra quyết định đúng đắn mọi lúc. Đây là lý do tại sao chúng ta đọc về các cuộc chiến trong sách lịch sử của chúng tôi. Những quyết định mà chúng ta đưa ra thường thiên vị, có nguồn gốc ích kỷ, v.v. Chúng ta không '

Tôi không nghĩ có một bài kiểm tra để kiểm tra AI. Điều này là do AI có nhiều định nghĩa, nhiều loại. Dù AI yếu hay mạnh đều có thể được gắn thẻ trong khi tìm kiếm câu trả lời cho các câu hỏi như: "Tôi muốn rằng tôi biết tôi muốn điều đó", "Tôi là ai và chính xác tôi đang làm gì (từ quan điểm của máy)", cộng với một số câu hỏi khác tôi đã đề cập ở trên.


3

Nó phụ thuộc vào cách kiểm tra được đưa ra. Ví dụ, khi mọi người tuyên bố rằng một chiếc máy đã vượt qua Thử nghiệm Turing vài năm trước, các tiêu chí khá yếu. Nó chỉ phải đánh lừa 30% số người trong 5 phút. Đó không phải là một thử nghiệm nhiều. Để đặt điều này trong viễn cảnh, có lẽ bạn sẽ không phát hiện tâm thần phân liệt, tự kỷ, khuyết tật học tập hoặc mất trí nhớ với tiêu chí này.

Mặc dù cường điệu, AI hiện tại có thể được phát hiện 100% thời gian bằng các câu hỏi khá đơn giản.


Điểm tốt. "Đưa ra đủ số lượng câu hỏi ..." (Tất nhiên, trong bài kiểm tra Voight-Kampff có vẻ khá hiệu quả với số lượng câu hỏi hạn chế;)
DukeZhou

2

Thử nghiệm Turing, hay bất kỳ biến thể nào của nó, là thử nghiệm đáng tin cậy về trí tuệ nhân tạo?

Cận thị

Có, nếu người ta định nghĩa thuật ngữ Trí tuệ nhân tạo theo thuật ngữ Trò chơi Bắt chước của Alan Turing hoặc một trong các biến thể của nó. Cách tiếp cận có thể đồng thời, cả hợp lệ và rất hạn chế như một định nghĩa về trí thông minh khi mọi người giải thích từ này trước khi AI xuất hiện.

Trí thông minh đã được chứng minh

Do đó, có một số lượng lớn các phương pháp thay thế để đo lường trí thông minh, nhân tạo hay cách khác.

  • Trở thành một bậc thầy cờ vua
  • Tác giả một chương trình cờ vua chiến thắng
  • Nhận giải thưởng quốc tế có tính chọn lọc cao
  • Tạo ra một chiến lược chiến thắng một cuộc chiến tranh hay hòa bình
  • Vượt qua hàng ngàn vòng loại trừ trong kinh doanh hoặc chính trị để trở thành Tổng thống
  • Tác giả bài viết xuất sắc, bài báo, kịch bản phim, bài giảng, bài phát biểu, sách hoặc bài thơ tạo ra sự thay đổi mô hình quan trọng của con người
  • Hiển thị kết quả cấp độ thiên tài trong bài kiểm tra Mensa
  • Trở thành một trong những người giàu nhất thế giới

Đo lường thông thường của trí thông minh

Nhưng đây là những phép đo về trí thông minh đặc biệt của một số loại, chủ yếu là do các nhà lãnh đạo trong các lĩnh vực này đã áp dụng trí thông minh đáng tin cậy trên nhiều lĩnh vực theo cách đó dẫn đến thành công đáng kể qua nhiều tình huống thực tế. Độ tin cậy là một thuộc tính của người sở hữu trí thông minh, chứ không phải kiểm tra trí thông minh.

Đây là những biện pháp thông minh hơn, nhưng có lẽ hợp lệ và đáng tin cậy hơn.

  • Nuôi dạy những đứa trẻ khỏe mạnh và đáng yêu như có thể kiểm chứng thông qua các cuộc phỏng vấn cẩn thận của bạn bè và cộng sự của các thành viên trong gia đình
  • Biện pháp lặp đi lặp lại và thành công của nhiều điều kiện thuộc các loại khác nhau đã từng được xác định là bị hỏng theo một cách hữu hình và có thể đo lường được và được sửa chữa một cách có thể đo lường được do áp dụng hiểu biết, phân tích và hành động khắc phục
  • Trí thông minh đàm thoại có thể đo lường được thông qua những người tham gia hội thoại quy kết thành công của chính họ cho các ý tưởng và ví dụ do nhà đàm thoại đặt ra

Các mục tiêu cuối cùng mong muốn thực sự là gì?

Có lẽ đặc điểm chính của Turing Test là nó là nhân tạo. Nếu trí tuệ nhân tạo là thứ chúng ta muốn từ phần mềm AI, thì đó là thứ chúng ta sẽ nhận được. Tuy nhiên, có khả năng chúng ta muốn một cái gì đó nhiều hơn hoặc ít hơn đáng kể.

Chúng tôi muốn nhiều hơn ở chỗ một số máy tính có thể là bạn bè, người cố vấn của chúng tôi và một nhân viên không được trả lương với khả năng đặc biệt dẫn đến thành công cá nhân của chúng tôi về thu nhập, ảnh hưởng, sự nổi tiếng hoặc di sản.

Chúng tôi muốn ít hơn ở chỗ chúng tôi muốn một số máy tính thực hiện các nhiệm vụ cụ thể trong miền và vẫn là công cụ hỗ trợ đầy đủ, có lẽ với tính cách và sự ấm áp, như một con tàu hoặc một số thiết bị phức tạp khác mà chúng tôi đặt tên con người, nhưng không thể đoán trước được khả năng vươn xa của trí tuệ con người.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.