Một AI cờ vua hoàn toàn tự đào tạo


46

Trong chừng mực mà tôi hiểu, có vẻ như, trước khi di chuyển, tất cả các phần mềm cờ vua mạnh

  1. kiểm tra hàng ngàn hoặc hàng triệu vị trí có thể, trong tương lai;
  2. đánh giá từng vị trí trong tương lai theo một số heuristic, được gọi là hàm đánh giá;
  3. đánh giá riêng biệt từng vị trí trong tương lai để kiểm tra , để quyết định xem có nên khám phá các phần tiếp theo từ vị trí đó hay không;
  4. chọn trong số các di chuyển có sẵn bằng minimax;
  5. sử dụng một cuốn sách mở đầu.

Càng xa càng tốt. Tuy nhiên, sức mạnh của một chương trình cờ vua dường như chủ yếu phụ thuộc vào chất lượng đánh giá và phương pháp phỏng đoán của nó - và cả trên cuốn sách mở đầu của nó, từ quan điểm của máy tính, vẫn là một heuristic khác. Một chương trình cờ như vậy rõ ràng, chỉ, biết chính xác nhiều về trò chơi cũng như con người đã tạo ra các heuristic. Chương trình dường như không có cái nhìn sâu sắc của riêng mình.

Có ai đã từng viết một chương trình cờ vua có cái nhìn sâu sắc của riêng mình chưa? Điều đó tự học trò chơi? Đó là đào tạo chính nó? Tất nhiên, một chương trình như vậy sẽ được cung cấp các quy tắc của trò chơi, và có lẽ sẽ được cung cấp thêm cơ sở hạ tầng tối thiểu và tĩnh, và có thể nhận ra và truy tố một người bạn đời bị ép buộc nếu tìm thấy. Tuy nhiên, nó sẽ không được cung cấp heuristic. Ví dụ, nó sẽ không được yêu cầu mở trò chơi về phía trung tâm, cũng không thích các tân binh hơn các hiệp sĩ, cũng không phải là phòng thủ của Sicily. Nó sẽ phải tự suy ra những nguyên tắc như vậy (hoặc, có thể hình dung, để tự mình khám phá những nguyên tắc tốt hơn).

Ở dạng thuần túy, một chương trình như vậy sẽ không bao giờ được cung cấp các trò chơi bậc thầy để nghiên cứu, mà chỉ các trò chơi của chính nó, được chơi với chính nó. Chỉ một khi được tự đào tạo đầy đủ, nó sẽ được tung ra trong cuộc cạnh tranh của con người.

Liệu một AI cờ vua thuần túy như vậy có tồn tại? Có một cờ tự động cơ học bao giờ xuất hiện? Thật vậy, người Thổ Nhĩ Kỳ cũ có thể tự dạy mình không?

Đây dường như là một thông báo ngắn gọn về một AI cờ vua thuần túy đã thất bại.

( Một câu hỏi liên quan đến tiếp tuyến đã xuất hiện trước đó trên trang web này, liên quan đến nghiên cứu trên máy vi tính về mở cờ.)

CẬP NHẬT

Câu hỏi được đưa ra bởi ba câu trả lời khác nhau, làm sáng tỏ tại thời điểm viết bài này, bởi @WesFreeman, @GregE. và @Landei. Cả ba đều được khuyến nghị mạnh mẽ và tôi sẽ cảm thấy có lỗi khi, theo chính sách của trang web, tôi chính thức chấp nhận một để loại trừ những người khác. Hãy để tôi ở đây cảm ơn và bày tỏ sự đánh giá cao của tôi về cả ba.

Câu hỏi muốn ngắn gọn. Tuy nhiên, một câu trả lời cho câu trả lời có thể chạy lâu hơn. Do đó, người đọc quan tâm có thể bỏ qua trực tiếp các câu trả lời và sau đó, nếu vẫn quan tâm, có thể quay lại để đọc bản cập nhật dài hơn sau đó.

Khi tôi đặt câu hỏi, tôi đã nghĩ đến một cái gì đó như sau.

Giả sử một ngôi làng giả thuyết ở ngoại ô của Shangri-La nơi người dân chưa bao giờ nghe nói về cờ vua. Trong chuyến thăm ngắn ngủi của bạn, bạn dạy cho những người lớn tuổi trong làng các quy tắc của trò chơi, nhưng không bao giờ hướng dẫn họ theo bất kỳ nguyên tắc nào của trò chơi. Hai trong số những người lớn tuổi chơi một trò chơi như những người lớn tuổi còn lại theo dõi, trong khi bạn (không muốn làm gián đoạn cuộc chơi bằng cách kibitzing) giới hạn bình luận của bạn cho các câu hỏi về các quy tắc. Không có hậu họa nào diễn ra sau trận đấu, cờ vua cũng không được chơi hay thảo luận lại trong khi bạn vẫn ở lại Shangri-La. Tuy nhiên, khi bạn khởi hành, không bao giờ quay trở lại, bạn để lại bộ cờ của bạn phía sau.

Trong sự vắng mặt của bạn, những người lớn tuổi dạy trò chơi cho mọi người. Một số người sau đó chơi một chút trong giờ giải trí, một số ít với sự nhiệt tình ngày càng tăng, những người chơi cờ vua thời trang của riêng họ.

Có thể không rõ ràng ngay lập tức với những người dân làng như vậy rằng một tay đua giỏi hơn một hiệp sĩ, nhưng mọi người vẫn có thể dần dần phát huy được sức mạnh tương đối của những người chơi cờ qua việc chơi nhiều trò chơi. Tương tự như vậy, có thể không rõ ràng ngay lập tức với họ rằng 1. a4 là một mở kém: họ có thể nhưng thử nó và xem xét kết quả.

Đến mức độ nào thì sự hiểu biết của dân làng về trò chơi cuối cùng sẽ hội tụ với thế giới bên ngoài? Thiếu một cuốn sách mở đầu, họ có thể phát triển các cuốn tiểu thuyết của riêng mình không? Tất nhiên, ban đầu, người ta không mong đợi sự mở cửa của dân làng sẽ rất tốt, nhưng, trong một vài thế kỷ cô lập, dân làng có thể phát triển một tiết mục mở đầu đáng kính, đối với tất cả những gì tôi biết.

Bất kỳ sự mở cửa nào của họ, được phát triển độc lập, sẽ chứng minh sự thú vị với thế giới bên ngoài, khi du khách tiếp theo đi qua để ghi chú lại, 200 năm sau? Liệu Shangri-La có thể mang đến cho thế giới những tác phẩm mới, tiểu thuyết, Phòng thủ của Shangri-La?

Nếu vậy, đối với câu hỏi ban đầu của tôi về cờ vua AI, điều tôi có trong đầu là ít nhiều điều này: một AI cờ vua có thể ít nhiều trùng lặp tiến trình cờ vua của dân làng ở ngoại ô Shanrgi-La?

Xem xét câu chuyện của Sussman trong câu trả lời của @ Landei dưới đây, chắc chắn rằng dân làng của tôi sẽ mang lại những định kiến ​​nhất định cho trò chơi. Ví dụ, họ sẽ mang đến một sự hiểu biết rằng sở hữu nhiều thứ hữu ích nói chung tốt hơn là sở hữu ít hơn, và do đó, để bắt các quân cờ của đối thủ có lẽ, thường là thích chịu đựng việc bắt giữ chính mình. Bản chất lãnh thổ của những người hư cấu của Shangri-La là một câu hỏi đối với văn học, nhưng người ta có thể cho rằng họ sẽ nhận ra một vị trí chỉ huy nhiều không gian hơn là một vị trí chỉ huy ít hơn. Và bất kỳ người mới sáng dạ nào, một khi đã cho xem một bộ cờ và được hướng dẫn trong các quy tắc của trò chơi, có thể suy ra rằng một nữ hoàng có khả năng tốt hơn một con tốt, chỉ đơn giản là nữ hoàng có tới 27 nước cờ,

Do đó, câu hỏi của tôi không cần phải được hiểu là ngụ ý một lệnh tuyệt đối, theo kiểu Sussman chống lại việc mang bất kỳ loại kiến ​​thức nào vào bàn cờ; nhưng đúng hơn là ngụ ý một lệnh chung đối với kiến ​​thức chuyên môn về cờ vua. Rốt cuộc (không quan tâm đến vấn đề tiến hóa của các quy tắc của trò chơi từ lâu), tại một thời điểm trong quá khứ, trò chơi cờ vua đầu tiên đã được chơi. Có thể người chơi đầu tiên đã mở 1. a4; nhưng cuối cùng anh ta đã học tốt hơn, và dạy những gì anh ta đã học cho các môn đệ của mình; người lần lượt học được nhiều hơn và dạy nhiều hơn, từng thế hệ, để cho chúng ta Kasparov.

AI có thể không làm điều gì đó như thế, chỉ trong vài tuần chứ không phải hàng thế kỷ?

Plato sẽ hoài nghi, tôi cho là vậy. Hume sẽ lạc quan hơn, nhưng câu hỏi không còn được giải quyết chỉ bằng triết lý. Bây giờ chúng ta có máy tính điện tử để kiểm tra đề xuất này và tôi đã tự hỏi trạng thái của nghệ thuật AI là gì. Các AI cờ vua tốt nhất hiện nay dường như là hệ thống chuyên gia hoàn toàn không thông minh, đánh bại tất cả mọi người trong khi không có gì trực quan. Tôi tự hỏi liệu những AI rộng hơn một chút, theo một nghĩa nào đó, thực sự nghĩ về cờ vua, đã có bất kỳ thành công đáng kể nào trong việc dạy bản thân trò chơi.

Tôi tập hợp rằng câu trả lời là không, có lẽ là không.


4
Đây là một trong những câu hỏi tốt hơn trên trang web này, thực sự.
Phổ

5
Có vẻ như câu trả lời là có vì DeepMind vừa công bố nghiên cứu về một trạng thái mới của môn cờ vua AI mà họ đã đào tạo từ đầu (chỉ tự chơi, không có trò chơi tham khảo). arxiv.org/pdf/1712.01815.pdf
Lalaland

1
Thêm vào nhận xét của @Lalaland, sau khi đào tạo tôi nghĩ 10 giờ nó đã nghiền nát hoàn toàn stockfish (không chắc là phiên bản nào) như thể stockfish là người mới bắt đầu. Khá nhiều chưa từng thấy trong các trò chơi động cơ và động cơ. Có vẻ như alphago zero thích chơi theo phong cách Tal
Ariana

2
"AI có thể làm điều gì đó như thế này trong vài tuần chứ không phải hàng thế kỷ không? Có lẽ là không." Chà, bạn đã đúng theo một cách nào đó ... Chỉ mất vài giờ.
dùng230452

1
Khá nhiều người chơi, chẳng hạn như CapTHER, được cho là đã tìm ra trò chơi bằng cách xem nó chơi một lần. Và hãy nhớ rằng Alpha Zero không có gì khác để suy nghĩ.
Philip Roe

Câu trả lời:


26

Bạn có một số điểm rất thú vị. Tôi có một chút kinh nghiệm trong nghiên cứu AI (M.Sc. của tôi là trong lĩnh vực này), vì vậy tôi nghĩ rằng tôi có thể cung cấp một số hiểu biết.

Nghiên cứu trong khu vực

Đầu tiên, nghiên cứu trong lĩnh vực này chắc chắn đang diễn ra - tìm kiếm "cờ tiếp cận tiến hóa" đã trở lại với bài báo này từ năm 2001, thực hiện khá chính xác những gì bạn đề xuất, để lại phương pháp tối thiểu / tối đa và chỉ sửa đổi chức năng đánh giá. Có thể đào thêm nhiều thứ nữa và tôi biết một số người đang làm việc trong lĩnh vực này nói chung.

Khả năng lý thuyết

Theo tôi, yếu tố hạn chế thực sự duy nhất cho việc tạo ra một ván cờ "thuần túy" chơi AI là thời gian tính toán. Hoàn toàn không có lý do tại sao một AI như vậy về mặt lý thuyết không thể được tạo ra bằng cách sử dụng các phương pháp hiện tại.

Thực tiễn

Có hai vấn đề chính với việc sử dụng các phương pháp tiến hóa hoặc di truyền trong việc phát triển chức năng heuristic cờ vua, thứ nhất là ngay cả ở cơ bản nhất, một chức năng heuristic cho cờ vua rất phức tạp. Chúng ta đang nói về hàng trăm quy tắc, định giá mảnh (có thể khác nhau dựa trên vị trí, v.v.), phân tích vị trí, v.v. Bạn sẽ cần một ngôn ngữ máy tính linh hoạt để mô tả các quy tắc này và sau đó các quy tắc này có thể được tạo ngẫu nhiên, bị đột biến, lai tạo với nhau, v.v ... Điều đó chắc chắn là có thể, nhưng tôi đoán bạn sẽ kết thúc với một bộ quy tắc bao gồm vài nghìn thực thể. Đó là một quy tắc rất lớn được thiết lập để phát triển linh hoạt.

Vấn đề thứ hai là để thực sự đánh giá quy tắc mới được sửa đổi của bạn, bạn phải chơi các trò chơi cờ vua và xem ai là người chiến thắng. Nếu bạn muốn làm điều này một cách "chính xác", bạn sẽ muốn cho cả hai người chơi nhiều thời gian để suy nghĩ, một cái gì đó tương tự như độ dài trò chơi thông thường. Tuy nhiên, chỉ chơi một đối thủ là không đủ, bạn muốn chơi nhiều đối thủ khác nhau và thậm chí có thể cùng một đối thủ, nhiều lần, trước khi bạn có thể thực sự tin rằng bạn đã tìm thấy sự cải thiện về sức mạnh của trò chơi. Điều này có thể có nghĩa là chơi một vài trăm trò chơi cho mỗi cá nhân trong dân số của bạn và điều đó mang lại cho bạn một thế hệ thuật toán của bạn.

Thông thường với các kiểu tiếp cận này, bạn sẽ tìm kiếm ít nhất vài trăm thế hệ hoặc với các chức năng phức tạp như một thế hệ cờ vua, vài trăm nghìn (thậm chí hàng triệu) thế hệ. Một số phép toán nhanh sẽ thuyết phục bạn rằng bạn cần vài nghìn giờ thời gian CPU cho một thế hệ, thậm chí nhân rộng ra một trang trại máy chủ có kích thước đáng kể, bạn có thể sẽ cần vài (có thể hàng trăm) năm để thực sự phát triển, chính xác như bạn đề cập đến trong bản cập nhật của bạn.

Vào cuối thời gian đó, bạn sẽ có một thuật toán thú vị mà có lẽ sẽ có vô số hiểu biết sâu sắc về trò chơi chưa bao giờ thực sự được khám phá. Thật khó để nói liệu chúng có hữu ích hay thậm chí dễ hiểu đối với con người hay không. Tại sao quy tắc này tồn tại? Bởi vì hơn vài ngàn trò chơi, nó dường như hoạt động.

Tương lai

Tôi không có nghi ngờ rằng những cách tiếp cận này sẽ ngày càng phổ biến hơn, khi sức mạnh tính toán tăng lên. Hiện tại, chúng ta đang ở thời điểm mà một cỗ máy có đủ thời gian tính toán để đánh bại (gần như tất cả) con người, nếu trí thông minh được chế tạo thủ công cẩn thận. Trong 20 năm nữa, rất có thể các bộ xử lý đã di chuyển nhiều đến mức một hoặc hai bước di chuyển sâu hơn không còn mang lại cho các máy "mã hóa cứng" đủ lợi ích, nhưng thường xuyên bị đánh bại bởi những cỗ máy trực quan kỳ lạ đã phát triển hàng triệu giờ tiến hóa đằng sau chúng.

Cập nhật tháng 5 năm 2018

Như Robert Kaucher đề cập trong một bình luận dưới đây, những tin tức gần đây xứng đáng được đề cập ở đây. Cụ thể, dự án AlphaGo của Google dường như là cách tiếp cận dựa trên AI thực sự khả thi đầu tiên đối với các loại trò chơi này và vào cuối năm 2017, tuyên bố đã giành chiến thắng trước StockFish 2 , sau khi được tái sử dụng cho nhiệm vụ.


Cảm ơn bạn. Tôi nhận thấy rằng bài báo mà bạn liên kết đào tạo AI của nó trước tiên chống lại các đối thủ không phải là con người và sau đó là chống lại phần mềm cờ vua còn tồn tại, đó không hoàn toàn là những gì bạn và tôi đã nghĩ. Một người theo chủ nghĩa Platon như tôi sẽ không ngạc nhiên khi biết rằng loại AI mà bạn và tôi đang thảo luận là một điều không thể thực tế (chúng tôi biết rằng đó không phải là bất khả thi về mặt lý thuyết bởi vì cờ vua có thể được giải quyết bằng lý thuyết bằng minimax); nhưng liệu một câu trả lời làm tôi ngạc nhiên không phải là vấn đề. Để chỉ là hỏi liệu một AI đã đạt được kỳ tích đề xuất. Câu trả lời dường như là không.
THB

2
@thb Tôi nghĩ rằng đã có một số lượng lớn các nỗ lực đối với loại AI này, mặc dù bạn có thể coi chúng là "không thành công". Tôi nghi ngờ rằng một nỗ lực cực kỳ thành công (ngày hôm nay) có thể sẽ được chơi ở cấp độ nghiệp dư rất yếu; một thành tựu lớn, chỉ là không có trong mắt công chúng. Ngoài ra, tôi không nghĩ rằng việc đào tạo chống lại các chương trình hiện có và con người là gian lận, chỉ là một sự tối ưu hóa rất lớn, mặc dù có thể thay đổi hướng chơi theo phong cách chơi của AI đang phát triển.
Daniel B

1
Nếu bạn quan tâm đến việc đọc thêm về phương pháp "thuần túy", có lẽ bạn sẽ gặp nhiều may mắn hơn khi tìm kiếm phương pháp "hợp tác cạnh tranh". Đây là cụm từ được sử dụng khi không có cách nào tốt để cung cấp thước đo hiệu suất bên ngoài (nghĩa là chúng ta không thể chơi với các động cơ cờ vua khác), vì vậy việc đào tạo AI phải phát triển bằng cách chơi nhiều phiên bản khác nhau. Nó chắc chắn có tác dụng, nhưng mất nhiều thời gian hơn, đó có lẽ là lý do tại sao nó là một cách tiếp cận ít theo đuổi hơn.
Daniel B

1
@DanielB AlphaZero có phải là AI không?
Harry Weasley

1
Bạn có thể muốn cập nhật câu trả lời của bạn. Chess.com/news/view/ từ
Robert Kaucher

17

Tôi nghi ngờ rằng những gì bạn đang hỏi về sẽ được phân loại là một loại thuật toán di truyền hoặc phương pháp tiếp cận thuật toán tiến hóa . Tôi nghi ngờ không có cách nào thực tế để thiết kế một thuật toán như vậy mà không thực sự nhúng một số mức độ sai lệch của con người ở mức cơ bản, vì lập trình viên vẫn phải xác định các tính năng tĩnh của một vị trí (đếm vật liệu, cấu trúc cầm đồ, phức màu, v.v.) theo đó AI sẽ phân loại và so sánh các vị trí từ các trò chơi khác nhau. Nếu bạn thực hiện tìm kiếm Google về thuật ngữ thuật toán ở trên trong bối cảnh cờ vua, bạn sẽ tìm thấy rất nhiều kết quả, nhưng có lẽ rất ít trong cách nghiên cứu nghiêm túc thực sự được sử dụng để xây dựng AI thành công, cạnh tranh.

Thực tế là, do hậu quả của luật Moore, máy tính bây giờ là những cỗ máy tính toán mạnh mẽ đến mức các phương pháp AI cực kỳ tinh vi không chỉ không cần thiết (về mặt chơi ở cấp độ cao hơn các đối thủ tốt nhất của con người), mà thậm chí còn có thể hình dung là phản tác dụng. Cờ vua là loại trò chơi trong đó - chủ yếu là do không gian tìm kiếm tương đối nhỏ của nó di chuyển hợp lý ở bất kỳ vị trí nào và sự tồn tại của các kết hợp chiến thuật (bao gồm các chuỗi kiểm tra, bắt giữ mảnh, đe dọa mất bạn tình hoặc mất vật chất thảm khốc, v.v.) - một cách tiếp cận mạnh mẽ với một số cách cắt tỉa cây tìm kiếm bảo thủ đồng thời là cách tiếp cận đơn giản nhất về mặt thuật toán và hiệu quả nhất. Nếu bạn tính đến sự sẵn có của các bảng kết thúc và mở sách, logic của phương pháp đó chỉ phát triển. Tôi hiểu rằng có ' vẫn còn rất nhiều lợi ích lý thuyết và giá trị tiềm năng trong thể loại tiểu thuyết AI mà bạn đang nói đến, nhưng tôi nghi ngờ cờ vua là đấu trường sai lầm để phát triển nó. Mặt khác, một trò chơi như Go, vốn ít tính chiến thuật hơn và bao gồm một không gian tìm kiếm rộng lớn hơn bao gồm các cách tiếp cận vũ phu không thực tế, có thể là một ứng cử viên tốt hơn cho nghiên cứu AI tiên tiến.


Tôi đã cập nhật câu hỏi AI trong câu trả lời của bạn. Bản cập nhật không ngắn, vì vậy, tùy chọn của bạn, khi bạn có thời gian, bạn có thể xem lại nó ở mức độ mà nó quan tâm đến bạn.
THB

2
Không có sự thiên vị của con người sẽ là cần thiết. Đơn giản chỉ cần tạo 1000 thuật toán ngẫu nhiên có khả năng chơi cờ hợp pháp, kết hợp chúng với nhau trong một giải đấu, sau đó chiếm 20% hàng đầu và áp dụng đột biến và trao đổi chéo để xây dựng thế hệ tiếp theo. Lặp lại qua một số quần thể trong một số thế hệ và bạn sẽ có một cái gì đó nửa vời vào cuối. Chức năng tập thể dục duy nhất cần thiết là thắng / thua.
siêu sáng

15

Xem trang Wikipedia về Chơi trò chơi chung . Đó là một lĩnh vực nghiên cứu tích cực. Có một giải đấu GGP hàng năm, trong đó các chương trình được đưa ra các quy tắc của một trò chơi mới, suy nghĩ về nó một lúc, và sau đó chơi trò chơi với nhau.

Nếu bạn đưa ra các quy tắc của cờ vua cho một chương trình GGP, tôi nghĩ bạn sẽ thấy rằng nó chơi mạnh hơn nhiều so với người mới bắt đầu và yếu hơn nhiều so với chương trình cờ được viết có mục đích.


13

Thật đáng để xem lại câu hỏi này trong bối cảnh thành công nổi bật gần đây của AlphaZero trước Stockfish 8 . Một sự phát triển hơn nữa của các chương trình AlphaGo và AlphaGo Zero của DeepMind , AlphaZero đã kết thúc với số điểm đáng kinh ngạc là +28 = 72 -0 so với một trong những động cơ cờ vua "truyền thống" mạnh nhất trên hành tinh.

AlphaZero tự dạy mình chơi thông qua học tập củng cố, đào tạo kiến ​​trúc mạng thần kinh của mình thông qua hàng loạt trò chơi chống lại chính nó. Theo giấy đi kèm :

  1. Các tính năng đầu vào mô tả vị trí và các tính năng đầu ra mô tả di chuyển, được cấu trúc như một tập hợp các mặt phẳng; tức là kiến ​​trúc mạng thần kinh được khớp với cấu trúc lưới của bảng.
  2. AlphaZero được cung cấp kiến ​​thức hoàn hảo về các quy tắc trò chơi. Chúng được sử dụng trong MCTS, để mô phỏng các vị trí phát sinh từ một chuỗi các bước di chuyển, để xác định chấm dứt trò chơi và ghi điểm bất kỳ mô phỏng nào đạt đến trạng thái cuối.
  3. Kiến thức về các quy tắc cũng được sử dụng để mã hóa các mặt phẳng đầu vào (ví dụ như đúc, lặp lại, không tiến triển) và các mặt phẳng đầu ra (cách các mảnh di chuyển, thăng tiến và giảm mảnh trong shogi).
  4. Số lượng di chuyển hợp pháp điển hình được sử dụng để mở rộng tiếng ồn thăm dò (xem bên dưới).
  5. Các trò chơi cờ vua và shogi vượt quá số bước tối đa (được xác định theo thời lượng trò chơi thông thường) đã bị chấm dứt và được chỉ định một kết quả rút ra; Các trò chơi cờ vây đã bị chấm dứt và ghi điểm với các quy tắc Tromp-Taylor, tương tự như công việc trước đó (29).

AlphaZero đã không sử dụng bất kỳ hình thức kiến ​​thức tên miền nào ngoài các điểm được liệt kê ở trên.

Tôi chắc chắn người ta có thể đặt câu hỏi về những thứ như phần cứng khác nhau đang được sử dụng - " AlphaZero ... đã sử dụng một máy duy nhất với 4 TPU . Stockfish ... đã chơi ở cấp độ kỹ năng mạnh nhất của nó bằng 64 luồng và kích thước băm 1GB. " - nhưng trong mọi trường hợp, kết quả của AlphaZero là một kết quả đáng chú ý và rất nhiều trong tĩnh mạch của OP.

Tiết lộ có lẽ còn hỗ trợ nhiều hơn cho việc chơi ít kiến ​​thức về miền cụ thể, ngoài việc đánh bại Stockfish trong cờ vua, AlphaZero còn được đào tạo tại shogi đến mức vượt qua chương trình vô địch Elmo, và dĩ nhiên cũng vượt qua người tiền nhiệm AlphaGo Zero trong Go .

Đây là một trong những trò chơi chống lại Stockfish, một Berlin, trong đó sự mất cân bằng vật chất cuối cùng là AlphaZero với cặp giám mục chống lại một hiệp sĩ và 4 con tốt cho Stockfish sau đó 31.Qxc7. Ở vị trí đó, tất cả các tác phẩm của AlphaZero đều được xếp hạng trở lại, với các giám mục trở lại hình vuông ban đầu của họ. Cuối cùng, sau khi các nữ hoàng bước ra những mảnh đen từ từ cơ động để nhặt những con tốt trắng, và đó là rèm cửa.

Cá kho - AlphaZero, 2017-12-04, 0-1
1. e4 e5 2. Nf3 Nc6 3. Bb5 Nf6 4. d3 Bc5 5. Bxc6 dxc6 6. OO Nd7 7. Nbd2 O-O 8. Qe1 f6 9. Nc4 Rf7 10. a4 Bf8 11. Kh1 Nc5 12. a5 Ne6 . Ncxe5 fxe5 14. Nxe5 Rf6 15. Ng4 Rf7 16. NE5 Re7 17. a6 c5 18. f4 Qe8 19. axb7 Bxb7 20. Qa5 ND4 21. Qc3 Re6 22. be3 RB6 23. Nc4 RB4 24. b3 a5 25. Rxa5 Rxa5 26. Nxa5 Ba6 27. Bxd4 Rxd4 28. Nc4 Rd8 29. g3 h6 30. Qa5 Bc8 31. Qxc7 BH3 32. Rg1 Rd7 33. Qe5 Qxe5 34. Nxe5 Ra7 35. Nc4 g5 36. RC1 Bg7 37. NE5 Ra8 38. NF3 Bb2 39. Rb1 BC3 40. Ng1 Bd7 41. NE2 BD2 42. RD1 be3 43. Kg2 Bg4 44. rE1 BD2 45. Rf1 RA2 46. h3 Bxe2 47. Rf2 Bxf4 48. Rxe2 Be5 49. Rf2 Kg7 50. g4 Bd4 51. RE2 Kf6 52. e5 + Bxe5 53. Kf3 RA1 54. Rf2 RE1 55. Kg2 + Bf4 56. c3 RC1 57. d4 Rxc3 58. dxc5 Rxc5 59. b4 RC3 60. h4 Ke5 61 . hxg5 hxg5 62. Re2 + Kf6 63. Kf2 Be5 64. Ra2 Rc4 65. Ra6 + Ke7 66. Ra5 Ke6 67. Ra6 + Bd6 0-1

11

Tôi nghĩ lý do chính khiến việc sản xuất một AI như vậy là khó khăn vì không gian cần thiết để lưu trữ "đào tạo" có hiệu quả.

Ngoài ra (như một phản hồi cho nhận xét tự đào tạo của bạn), tự đào tạo có thể gây bất lợi trong khi cố gắng cải thiện AI như vậy - Tôi đã thực hiện một số nghiên cứu với tic-tac-toe (đơn giản hơn nhiều) và nó đã tìm thấy tất cả các loại về những cách khủng khiếp để giành chiến thắng (và huấn luyện những cách khủng khiếp đó) bởi vì cả hai bên đã chơi khủng khiếp. Phải mất nhiều thời gian hơn để có được hiệu suất hợp lý với việc tự đào tạo hơn là đào tạo chống lại một AI có tầm nhìn tốt trong tic-tac-toe.

Tuy nhiên, tôi nghĩ sẽ rất thú vị khi thấy một hybrid sử dụng cả tìm kiếm sâu và "đào tạo" - một số loại cơ sở dữ liệu được lưu trữ của các vị trí cho midgame (thay vì chỉ kết thúc và mở). Nó sẽ cần rất nhiều không gian.

Có thể bạn đang nghĩ đến một cách tiếp cận AI "thực tế" hơn để tìm hiểu các khái niệm vị trí thay vì thắng / thua / hòa, nhưng tôi không nghĩ rằng nó sẽ rất hiệu quả (so với các động cơ mạnh).


Câu trả lời được đánh giá cao. Điều tôi tin rằng tôi có trong đầu là một AI (a) sở hữu khả năng minimax nhưng (b) thiếu chức năng đánh giá được xác định trước. Một AI như vậy nhất thiết sẽ giải quyết một trò chơi nhỏ như tic-tac-toe bằng minimax thuần túy. Trong cờ vua, một trò chơi chỉ nhạy cảm về mặt lý thuyết với minimax, AI sẽ đánh giá không phải vị trí hiện tại trên bảng mà là vị trí trong tương lai, sau đó minimax sẽ chọn nước đi. Có thể nói một cách lỏng lẻo rằng Nimzowitsch đã cách mạng hóa cờ vua bằng cách đưa ra những đánh giá được biết đến. Nếu vậy, một máy có thể làm như vậy?
ngày

1
Vì vậy, bạn đang nói rằng nó sẽ phát triển chức năng đánh giá riêng của mình?
Đêm giao thừa Freeman

2
@thb, với tư cách là một lập trình viên, tôi nghĩ vấn đề với quan niệm của bạn là, theo như tôi có thể thấy, không có AI cờ vua hợp lý nào có thể bắt đầu với một bảng hoàn toàn trống cho chức năng đánh giá. Người ta có thể viết một AI phân tích các trò chơi cho các mẫu và sử dụng các phương pháp thống kê / xác suất (ví dụ suy luận Bayes) để điều chỉnh giá trị và ra quyết định của nó, nhưng lập trình viên phải xác định mô típ, yếu tố vị trí nào, di chuyển các chuỗi và theo tiêu chí nào để đánh giá chúng. Nói cách khác, cốt lõi cơ bản của chức năng đánh giá vẫn cần phải được thiết kế bởi con người.
Greg E.

1
Thật thú vị khi xem những gì một công cụ minimax di truyền, ví dụ, nếu bạn bắt đầu tất cả các phần với cùng một giá trị vật chất, dựa trên thắng / thua / hòa và để các giá trị vật chất biến đổi. Tôi chắc chắn rằng những người tạo ra động cơ đã thử tinh chỉnh những thứ này, như tạo ra các hiệp sĩ 2.9 và các giám mục 3.1 cầm đồ.
Đêm giao thừa Freeman

1
@thb, tôi không phải là chuyên gia, nhưng tôi nghĩ đó là trường hợp. Ngay cả AI bạn liên kết đến cũng bị hạn chế bởi các thành kiến ​​lập trình viên. Nếu bạn đọc tài liệu nghiên cứu ban đầu, nó lưu ý rằng "vectơ đặc trưng" đào tạo chức năng đánh giá bao gồm các tính năng bảng "được thiết kế cẩn thận bằng tay". Đó là, lập trình viên vẫn phải xác định tập hợp các yếu tố vị trí tĩnh mà AI dựa trên quyết định của mình. Ưu điểm chính của mạng lưới thần kinh cho dự án cụ thể này, tôi nghĩ, là việc đào tạo có thể được song song hóa, cho phép xử lý không đồng bộ số lượng lớn các trò chơi một cách hiệu quả.
Greg E.

10

Tôi chỉ muốn mở rộng câu trả lời của Greg và Wes ở đây. Loại AI mà thb đang đề xuất đơn giản là không tồn tại với sự tinh vi cần có cho ứng dụng này. Và ngay cả khi họ đã làm, tôi nghi ngờ họ sẽ thất bại trong việc này. Như thể thb muốn một AI có mục đích chung mạnh mẽ có thể được dạy các quy tắc cơ bản của trò chơi và sau đó được gửi đi. Nhưng nếu bạn nhìn vào các AI có mục đích chung đang được phát triển, tất cả chúng đều được dạy những thứ như nhận dạng đối tượng và nhận dạng giọng nói ở cấp độ 1 đến 2 tuổi. Bất kỳ mục đích chung nào trước tiên, AI sẽ cần phải có sự tinh tế để có thể hiểu trò chơi là gì ngay cả trước khi nó có thể hiểu cách chơi trò chơi. Bạn không thể thiết kế AI cho mục đích chung và mong muốn nó hoạt động giống như một AI hẹp hoặc chuyên dụng. Một mục đích chung AI sẽ cần được dạy cờ như một người và bạn không thể mong đợi đưa hai người chơi mới làm quen với lịch sử cờ vua và tự phát minh lại các mở và các chủ đề chiến lược. Sẽ phải mất hàng trăm trường hợp AI chơi với nhau, mỗi lần truy cập vào dữ liệu lịch sử của tất cả các trò chơi của họ qua hàng trăm ngàn lần lặp. Và mỗi AI sẽ cần phải có những đặc điểm riêng biệt có trọng số ở các cấp độ khác nhau.

Con người phải mất gần 500 năm để có được từ Rodrigo (Ruy) López de SeguraPedro Damião đến Paul Morphy và sau đó xem xét những thay đổi tiếp theo xảy ra giữa vở kịch của SteinitzAlekhine. Và tất cả những thay đổi đó xảy ra thông qua sự năng động của hàng trăm ngàn người chơi với tính khí khác nhau và các đặc điểm ảnh hưởng khác (chẳng hạn như các hiệp sĩ ưa thích ngẫu nhiên hơn các giám mục hoặc giám mục trên các hiệp sĩ) không đề cập đến phong cách chơi và thời trang. Tất cả những điều này đã góp phần vào sự năng động của sự thay đổi ảnh hưởng đến cờ vua qua nhiều thế kỷ. Không có AI yếu - ngay cả AI có mục đích chung yếu - có thể nhân đôi loại máy phát điện đó vì nó thiếu ham muốn. Chỉ có ham muốn mới có thể khiến một cái gì đó ngồi hàng giờ trong nhiều ngày để phân tích một sự mở đầu với ý định làm hỏng nó hoặc cải thiện nó sau khi một đối thủ "đánh bại" nó. Thực sự đây là loại động lực để phân tích và chuẩn bị cải thiện lối chơi trong nhiều thế kỷ - không phải là trò chơi mù quáng của hàng triệu trò chơi giữa những người chơi yếu như nhau.

Nó giống như bắt một nhóm người không nói tiếng Anh và không bao giờ đọc những bậc thầy văn học bản ngữ của họ và đưa họ vào một căn phòng có tiếng Anh như một cuốn sách Ngôn ngữ thứ hai và mong họ sẽ tìm ra thứ gì đó giống như các tác phẩm của Shakespeare. Nó sẽ không bao giờ, sẽ không bao giờ xảy ra.

EDIT : Tôi nên biết rõ hơn là đưa ra yêu sách này bởi vì nó đã xảy ra .

Trò chơi Alpha Alpha đã không được 'dạy' theo nghĩa truyền thống, anh giải thích Chess.com. Điều đó có nghĩa là không có cuốn sách mở đầu, không có bảng kết thúc và dường như không có thuật toán phức tạp nào phân tích sự khác biệt phút giữa các con tốt trung tâm và con tốt bên. Điều này sẽ giống như một robot được cấp quyền truy cập vào hàng ngàn bit và bộ phận kim loại, nhưng không có kiến ​​thức về động cơ đốt, sau đó nó thử nghiệm nhiều lần với mọi sự kết hợp có thể cho đến khi chế tạo được một chiếc Ferrari. Chương trình có bốn giờ để tự chơi nhiều lần, từ đó trở thành giáo viên của chính mình.

Tôi tiếp tục, rõ ràng vô căn cứ:

Chúng tôi chấp nhận tất cả những kiến ​​thức ngầm mà chúng ta có về thế giới. Để có thể hiểu rằng nếu tôi phải ghép các mảnh gỗ và đinh, thì một cái búa sẽ hữu ích hơn cho tôi so với một cái tuốc nơ vít, trước tiên tôi phải hiểu rằng một số loại vật nhất định có ích hơn trong những tình huống nhất định so với những thứ khác. Tôi cũng phải hiểu rằng mọi thứ có công dụng có thể được áp dụng cho mục tiêu. Đây là những heuristic. Nếu AI không thể nói rằng một số phần nhất định có giá trị hơn các phần khác, làm sao nó có thể hiểu bạn đời là gì? Nếu nó không thể được lập trình với các heuristic cụ thể, nó phải có khả năng ngoại suy các ý tưởng này như trải nghiệm hình thức "giá trị" và "tiện ích". Và đó không phải là lĩnh vực của AI hẹp. Đó là lĩnh vực của mục đích chung, AI mạnh mẽ.


1
Câu trả lời tuyệt vời. Tôi nghĩ rằng đoạn đầu tiên của bạn thực sự kết tinh ý tưởng mà tôi đã cố gắng vượt qua, nhưng làm như vậy với sự sáng suốt hơn.
Greg E.

Cảm ơn, Greg. Tôi chỉ muốn nói thêm rằng tôi đang nói về một AI có mục đích chung yếu. Tôi tin rằng một AI mạnh mẽ thực sự có thể làm điều gì đó như thế này qua nhiều trường hợp qua nhiều lần lặp trong khung thời gian được nén rất cao. Nhưng chúng ta chưa có AI mạnh. vi.wikipedia.org/wiki/Strong_AI
Robert Kaucher

Tôi đồng ý với tất cả những gì bạn nói ngoại trừ phần mong muốn. AI có thể ngồi hàng giờ để làm bất cứ điều gì các nhà thiết kế muốn nó - đủ sức mạnh máy tính có thể giải quyết cờ vua, chỉ là chúng ta chưa có đủ sức mạnh.
Giao thừa Freeman

Đó là sự thật, Wes, nhưng sau đó chúng ta đang đưa sự thiên vị của "lập trình viên" hoặc bất cứ điều gì vào AI; đó là một trong những điều mà tác giả của câu hỏi không muốn.
Robert Kaucher

@EveFreeman, tôi nghĩ bạn đang hiểu sai những gì tôi đang nói. Tôi không nói rằng máy tính sẽ không "giải cờ vua" Tôi đang nói rằng kịch bản cụ thể của OP bị cản trở đến mức nó sẽ không hoạt động. Nếu hệ thống không có heuristic làm thế nào nó có thể đặt một giá trị trên các mảnh?
Robert Kaucher

9

Hãy thiền về AI Koan sau đây:

Vào thời mà Sussman là một người mới, Minsky đã từng đến với anh ta khi anh ta ngồi hack tại PDP-6. Bạn đang làm gì vậy? Tôi đang đào tạo một mạng lưới thần kinh có dây ngẫu nhiên để chơi Tic-Tac-Toe Sussman trả lời. Tại sao mạng lưới có dây ngẫu nhiên? Sussman nói, tôi không muốn nó có bất kỳ định kiến ​​nào về cách chơi, ông Sussman nói. Minsky sau đó nhắm mắt lại. Tại sao bạn nhắm mắt lại? Sầm, Sussman hỏi giáo viên của mình. Vì vậy, căn phòng sẽ trống rỗng. Ngay lúc đó, Sussman đã giác ngộ.

Các ứng dụng của chúng tôi luôn có định kiến, cho dù bạn có nhắm mắt hay không ...


Giai thoại của bạn có sức thuyết phục nhất. Trong phạm vi mà nó làm bạn quan tâm, giai thoại của bạn đã nhắc tôi mở rộng câu hỏi bằng một bản cập nhật, mà bạn có thể thấy ở trên khi bạn có thời gian.
THB

8

Có ai đã từng viết một chương trình cờ vua có cái nhìn sâu sắc của riêng mình chưa? Điều đó tự học trò chơi? Đó là đào tạo chính nó?

Đúng. Kiểm tra động cơ cờ vua Hươu cao cổ được viết bởi Matthew Lai. Ông đã viết công cụ cờ vua như một phần của nghiên cứu Trí tuệ nhân tạo của mình để lấy bằng thạc sĩ về khoa học máy tính.

Có rất nhiều cuộc thảo luận về điều này năm ngoái trên diễn đàn lập trình cờ vua TalkChess . Tôi biết bởi vì tôi là một tác giả động cơ cờ vua có động cơ mạnh tương đương với Hươu cao cổ. Tuy nhiên, tôi đã triển khai động cơ của mình bằng các kỹ thuật truyền thống trong khi tác giả của Gi hươu cao cổ đã huấn luyện động cơ của mình bằng cách sử dụng "học tăng cường khác biệt theo thời gian với các mạng lưới thần kinh sâu sắc". Matthew vẫn phải thực hiện tìm kiếm alpha / beta truyền thống để tự động đánh giá một position- nói cách khác, nhìn về phía trước nhiều động thái. Sự đổi mới của ông là trong việc đào tạo động cơ để đánh giá một vị trí tĩnh . Để so sánh, tôi đã viết kiến ​​thức cụ thể vào thói quen đánh giá tĩnh của động cơ.

Tôi đã viết mã để điều chỉnh các tham số đánh giá bằng thuật toán swarm (xem trang Cảm ơn trên blog của tôi để biết các liên kết đến thảo luận kỹ thuật) đã mang lại kết quả tích cực - một công cụ mạnh hơn. Tuy nhiên, đây không phải là một nhiệm vụ khiến động cơ "học" nhiều như giảm thiểu lỗi trong một không gian cực lớn của các tham số đánh giá (thứ tự 10 ^ 150 kết hợp tham số rời rạc).

Matthew thảo luận về luận án của mình trên diễn đàn TalkChess. Anh ấy làm việc cho Google trên DeepMind ngay bây giờ, nếu tôi nhớ chính xác.

Ngoài ra, hãy xem blog của Thomas Petzke . Ông đã viết một công cụ cờ vua cực kỳ mạnh, iCE và sử dụng các thuật toán di truyền để cải thiện đánh giá tĩnh của động cơ. Xem các bài đăng của anh ấy từ năm 2013 trở về trước, chẳng hạn như Học tập tăng dần dựa trên dân số .


Chào mừng bạn đến với diễn đàn! Cộng với một.
SmallChess


5

Một tìm kiếm Google như thế này có thể cho ra kết quả như thế này .

Đặc biệt nhất, tôi tin rằng bạn sẽ muốn xem bài báo này . Họ cung cấp cho công cụ của họ một số dữ liệu ban đầu như giá trị mảnh, vì vậy đó không chính xác là những gì bạn yêu cầu, nhưng nó hoạt động khá tốt.


+1 vì tôi đánh giá cao trích dẫn thú vị của IEEE. Tôi tình cờ đã quen thuộc với trang NeuroChess. Không ai trong số họ dường như làm khá những gì tôi đã nghĩ trong đầu.
THB

3

Điều đó là có thể với máy học.

Mở sách của động cơ cờ vua sử dụng máy học. Công cụ kiểm tra các dòng mở trong cuốn sách bằng cách chơi chúng, nếu một dòng ghi điểm tốt hơn so với dòng khác, thì nó thúc đẩy dòng đó trong cây mở. Trong thời gian, động cơ học các dòng tốt hơn.

Sau khi kết thúc giai đoạn mở, động cơ dừng sử dụng sách và bắt đầu sử dụng chức năng đánh giá.


Làm thế nào để thực hiện một công cụ tự học bằng cách sử dụng máy học?

Hãy tưởng tượng một động cơ sử dụng một cuốn sách mà không có chức năng đánh giá. Và cuốn sách ban đầu trống rỗng. Vì vậy, động cơ không có kiến ​​thức về cờ vua.

Engine bắt đầu chơi với cuốn sách trống này và không đóng sách cho đến khi kết thúc trò chơi. Chúng ta có thể nghĩ nó giống như một công cụ thông thường sử dụng một cuốn sách mở đầu cho đến cuối trò chơi.

Theo thời gian, động cơ sẽ tìm thấy sự tiếp nối tốt nhất theo thống kê, vì các đường xấu sẽ ghi điểm kém hơn theo thời gian. Nhưng tất nhiên, rất nhiều trò chơi nên được chơi để có được một cuốn sách hay. Tôi không biết có bao nhiêu, nhưng nhiều như chúng ta có thể nói không thực tế.

Cập nhật tháng 12 năm 2017 : Chà, tôi đoán Alpha Zero đã chứng minh tôi sai khi tự luyện tập đủ mạnh để đánh bại một trong những động cơ mạnh nhất, Stockfish, với số lượng trò chơi thực tế .


2

Bất cứ điều gì bạn cố gắng trong lĩnh vực này, hãy chắc chắn đọc câu chuyện đầu tiên của Turry tại đây: http://waitbutwhy.com/2015/01/art bát-intellect-revolution-2.html

TL; DR; phiên bản spoiler theo yêu cầu:

Trong câu chuyện của Turry, AI tự rèn luyện của Turry phải viết những ghi chú viết tay đẹp và cuối cùng loại bỏ con người vì họ không cần thiết để đạt được mục tiêu rõ ràng vô hại là viết những ghi chú viết tay đẹp. Điều tương tự là một động cơ cờ tự đào tạo với AI rất có thể cũng sẽ loại bỏ con người vì chúng không cần thiết để cải thiện mục tiêu rõ ràng vô hại là cải thiện kỹ năng chơi cờ.


Câu trả lời của bạn rất thú vị, mặc dù có lẽ không hoàn toàn thuyết phục. Tôi đã đọc bài viết liên kết (cả hai phần) về lời khuyên của bạn. Nhà văn làm suy yếu trường hợp của mình một chút bằng cách tấn công một số người đàn ông rơm, nhưng anh ta là một người chu đáo. Tôi không nghĩ rằng tôi có bất cứ điều gì giống như Turry trong bài viết. Một bàn cờ 8 x 8, trong đó hai người chơi có 40 lượt chơi rời rạc, đơn giản là một trường hợp đơn giản như vậy. Tôi thấy đáng chú ý là AI thậm chí không thể nghĩ về cờ vua một cách chung chung. Đối với một cái nhìn trái ngược, phân công đọc: Feser, Edward. Sự mê tín cuối cùng. Tuy nhiên, +1 cho lãi suất.
THB

1

Và có AlphaZero. Kỷ niệm một thế hệ hoàn toàn mới của động cơ cờ vua


0

Việc sử dụng thuật ngữ nhân học khi làm việc với các hệ thống máy tính là một triệu chứng của sự non nớt chuyên nghiệp

Từ làm thế nào để chúng ta nói sự thật có thể làm tổn thương? bởi Edsger W.Dijkstra tổng hợp khá nhiều giả định sai lầm trong câu hỏi của bạn. Trí tuệ nhân tạo có thể là nhân tạo nhưng nó không phải là trí thông minh theo nghĩa của con người.

Trong các bài giảng Reith năm 1984 cho BBC, nhà triết học người Mỹ John Searle giải thích chính xác những gì sai với AI cứng. Tóm tắt "quá dài, không nghe" về lập luận của ông là "Cú pháp không phải là ngữ nghĩa" nhưng tôi vẫn khuyến khích bạn ít nhất là nghe bài giảng 2 "Lon bia & máy thịt ".

Khi bạn đã nắm được những gì Dijkstra và Searle đã nói hơn 30 năm trước, bạn sẽ nhận ra điều gì sai với câu hỏi của mình:

Có ai đã từng viết một chương trình cờ vua có cái nhìn sâu sắc của riêng mình chưa? Điều đó tự học trò chơi?

Con người có "hiểu biết" và có thể học hỏi. Máy tính không thể. Ngôi làng của người nguyên thủy của bạn có thể qua nhiều thế kỷ tái tạo lý thuyết mở cờ nhưng máy tính thì không.


Bạn có cho rằng máy tính sẽ không đạt đến trí thông minh ở cấp độ con người, hay thậm chí là "suy nghĩ" và "hiểu biết" được dành riêng cho con người?
BlindKungFuMaster

@BlindKungFuMaster Nếu bạn gặp khó khăn khi nghe "Lon bia và máy thịt" trong liên kết ở trên, bạn sẽ hiểu rõ John Searle nghĩ gì. Ông đã thuyết phục tôi và tôi chia sẻ quan điểm của mình.
Tháp Brian

Hiểu biết đơn giản về các chương trình máy tính AI của Searle là có thể chấp nhận được, sau tất cả chỉ là năm 1984. Nhưng các kiến ​​trúc AI hiện đại chỉ bắt chước kiến ​​trúc của tâm trí con người, do đó, chỉ có kiến ​​trúc được mô tả theo cú pháp, chứ không phải là "suy nghĩ". "Sức mạnh (chưa hoàn toàn) tương đương với sức mạnh của bộ não con người" đến từ việc ăn một lượng lớn dữ liệu, bằng cách "học hỏi". Chỉ ở bước này là nội dung ngữ nghĩa được nắm bắt.
BlindKungFuMaster

Vì vậy, đối số Phòng Trung Quốc là thiếu sót khi cho rằng bạn có thể mô phỏng sự hiểu biết với một quy tắc lớn, thực tế là tương đối vô lý, và bằng cách nói trước khả năng thay vào đó nội dung ngữ nghĩa có thể được nắm bắt bởi kiến ​​trúc phù hợp từ một lượng lớn dữ liệu. Trên thực tế, đây là những gì Xử lý ngôn ngữ tự nhiên nói về những ngày này: cs224d.stanford.edu/syllabus.html
BlindKungFuMaster

@BlindKungFuMaster Có một từ khóa trong những gì bạn nói nó xuất hiện với tôi mà bạn không hiểu. Đó là từ "mô phỏng". Tôi đã có 35 năm làm kỹ sư phần mềm máy tính và trong thời gian đó tôi có nhiều trình giả lập và cũng tự viết một vài thứ. Bộ mô phỏng thường là thành phần quan trọng của một dự án nhưng trong một dự án thời gian thực, chúng không bao giờ thay thế hoàn toàn thiết bị mục tiêu. Không nghi ngờ gì máy tính là tuyệt vời trong việc mô phỏng trí thông minh và sự hiểu biết ngữ nghĩa nhưng chúng không bao giờ có thể đạt được ý thức, ý chí, sự hiểu biết.
Tháp Brian

0

Câu trả lời này được đưa ra bởi người hỏi của câu hỏi ban đầu, bốn năm sau câu hỏi. Nó không thay thế cho hoặc thay thế các câu trả lời được đưa ra trước đó, vì hầu hết các câu trả lời trước đó thú vị hơn câu trả lời này. Tuy nhiên, câu trả lời này có thể thêm một số bối cảnh bổ sung.

Theo như tôi có thể nói, hầu hết các nghiên cứu về AI dường như hoàn toàn đưa ra tiền đề rằng suy nghĩ và lý trí chỉ là hiện tượng vật chất, hoặc ít nhất là kết quả không thể phân biệt được với suy nghĩ và lý trí nhất thiết phải đạt được chỉ bằng các quá trình vật chất. Tôi không tranh chấp tiền đề (cũng không phải ở đây thúc đẩy nó, cho vấn đề đó). Tôi chỉ quan sát rằng nó dường như một tiền đề.

Và, sau tất cả, trong nghiên cứu AI, làm thế nào đây không phải là tiền đề? Các nhà nghiên cứu AI phải làm việc thông qua các quy trình vật chất, cho dù họ sẽ hay không.

Các học sinh của triết học hiện thực , trở lại qua Duns Scotus, St. Thomas, Aristotle và Plato, đã có nhiều điều để nói về lý thuyết của tâm trí. Những người đại diện như Kant đã có những điều khá khác nhau để nói. Nghiên cứu AI có lẽ gần với Kant hơn, nhưng điều này không làm cho các học sinh sai.

Phải thừa nhận rằng, có một Thiên Chúa-of-the-lỗ hổng phản đối mà có xu hướng bật lên vào thời điểm này trong cuộc nói chuyện của các loại hiện nay, tuy nhiên một nhà triết học chuyên nghiệp sẽ cho bạn biết rằng các cuộc tấn công phản đối Thiên Chúa-of-the-khoảng cách một người đàn ông rơm, rằng sự phản đối này có xu hướng chỉ hữu ích đối với những người không nghiên cứu triết học và do đó không biết họ đang nói về cái gì. Theo Aristotle, đó là nhân quả chính thứccuối cùng có thể liên quan đến câu hỏi về AI cờ vua tự đào tạo. Tuy nhiên, theo thuật ngữ của Aristotlean, nhà nghiên cứu AI hoạt động hoàn toàn bằng vật chất và đặc biệt là quan hệ nhân quả hiệu quả(ngoại trừ có lẽ là xiên, trong chừng mực khi các huấn luyện viên của con người đích thân mang các yếu tố chính thức và cuối cùng vào hệ thống). Nếu lý trí là chính thức, nếu suy nghĩ là cuối cùng, nếu phòng Trung Quốc của Searle chứng tỏ là một sự bất khả thi về mặt bản thể (như nó có thể), thì có thể là một AI cờ vua hoàn toàn tự đào tạo thậm chí không thể đạt được về mặt lý thuyết.

Tôi nghi ngờ rằng một hoàn toàn tự đào tạo cờ vua AI có thể được thực sự đạt được, và sẽ-rằng, trong điều kiện Aristotlean, này câu hỏi sẽ chứng minh được đầy đủ framable trong quan điểm về quan hệ nhân quả chỉ đơn thuần là hiệu quả. Tôi hoài nghi hơn về AI mạnh mẽ nói chung, nhưng những điều này sẽ được chứng minh bằng kinh nghiệm, phải không? Không ai thực sự biết.

Triết lý về nhân quảtâm trí là tinh tế, được nắm bắt bởi một số ít (và có lẽ bởi rất ít, ngay cả trong số các nhà nghiên cứu AI, những người đàn ông thực tế hơn). Nếu bạn muốn học triết lý như vậy, nó cũng đáng để học hỏi; nhưng hãy lưu ý rằng, trên Internet và thậm chí thường xuyên được in, việc tìm giải thích sai lệch dựa trên những hiểu lầm không được kiểm soát là cực kỳ dễ dàng. Đối với tiền của tôi, giáo viên giới thiệu tốt nhất viết hôm nay về chủ đề này là Edward Feser, người có sách vẫn được in với giá cả hợp lý. Bạn có thể học hỏi nhiều hơn từ anh ấy.

Tuy nhiên, người ta nghi ngờ rằng ngay cả Tiến sĩ Feser sẽ mạo hiểm trả lời có thẩm quyền cho câu hỏi hiện tại! Câu trả lời vẫn được chứng minh trong các phòng thí nghiệm của AI.


-3

Tôi muốn họ phát hành mã, sau đó chúng ta có thể nói chuyện. Không dễ để giải cờ vua, Alpha sẽ không giải quyết nó ngay cả trong nửa thế kỷ. Vui thay, nó vẫn chơi 1.d4. Tại sao? Bởi vì nó đã được đào tạo về các trò chơi của con người và lý thuyết con người cho tỷ lệ hiệu suất cao nhất cho 1.d4. Điều đáng thương là không biết 1 ... c5 đạt được kết quả hòa trong 8 lần di chuyển. Bây giờ họ muốn tôi tin rằng Alpha đã không sử dụng một cuốn sách mở đầu mô phỏng ... Họ nói rằng Alpha đã chơi rất tuyệt. Vâng, vâng, với một số ngoại lệ. 1.d4 chắc chắn không nói tốt về mức độ thông minh mà chương trình đạt được. May mắn thay, SF thậm chí còn yếu hơn trong giai đoạn mở đầu. :)


3
Bạn đưa ra những tuyên bố táo bạo khi nói rằng 1. ... c5 đạt được kết quả hòa trong 8 lần di chuyển và Stockfish rất yếu trong giai đoạn mở màn. Bạn có thể vui lòng cung cấp tài liệu tham khảo cho các yêu cầu này?
Pablo S. Ocal

1
1.d4 chắc chắn không nói tốt về mức độ thông minh mà chương trình đạt được. Là một người chơi 1.d4, tôi tự hỏi liệu tôi có nên xem xét rằng trí thông minh của tôi đang bị xúc phạm ở đây không.
Evargalo

Mặc dù họ chưa phát hành mã hoặc thậm chí xuất bản bài báo, một dự án tái tạo kết quả của họ đã được đưa ra: lczero.org Bạn thậm chí có thể chơi với " AlphaZero
Junyan Xu
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.