Cách sử dụng trí tuệ nhân tạo trong cờ vua máy tính


19

Trong một số bài báo (lịch sử), cờ vua đã được gọi là drosophila của trí tuệ nhân tạo. Mặc dù tôi cho rằng trong nghiên cứu hiện tại, ứng dụng đơn thuần của thuật toán tìm kiếm là khoa học máy tính tiên tiến nhất , tôi tin rằng vẫn còn những khu vực có thể áp dụng (và thực hành) các kỹ thuật AI.

Một ví dụ đơn giản sẽ là mở sách học trong đó người ta có thể dạy chương trình sử dụng hay không sử dụng một số động tác nhất định trong phần mở đầu vì chương trình không phù hợp với một số loại vị trí nhất định. Chúng ta có thể sử dụng một hình thức học lại thông tin và tự động hóa điều này: Tôi cho rằng tôi có thể chơi chương trình chống lại chính nó và tăng xác suất thắng các dòng và giảm xác suất thua các dòng.

Ví dụ phức tạp hơn là sử dụng hàm đánh giá học tập (ví dụ: người ta có thể điều chỉnh các giá trị của các bảng vuông mảnh ). Tuy nhiên, tôi đang nghĩ:

  • đưa ra tất cả các tiếng ồn do có một lượng lớn các vị trí thực tế (trái ngược với số lượng các dòng mở thực tế)
  • và với chi phí (thời lượng) của một ván cờ trên máy tính và nhu cầu chơi tải.

Làm thế nào một người có thể làm điều này một cách hiệu quả? (hoặc tôi nên xem xét các kỹ thuật khác, ví dụ như mạng lưới thần kinh.)


3
Cách tiếp cận tiêu chuẩn là minimax được cắt tỉa alpha-beta. với một heuristic. Đó là từ gia đình Tìm kiếm AI, thay vì từ gia đình máy học.
Lyndon White

2
Các bậc thầy cờ vua thực tế về cơ bản chỉ cần nhớ tất cả các trò chơi mà họ đã chơi trước đây ... Vì vậy, họ có khả năng ghi nhớ mạnh mẽ.

2
Ngoài ra còn có yêu cầu phản tố. Tôi không thể nhớ ai đã nói nhưng nó như thế này. Các nhà sinh học sử dụng các thí nghiệm trên drosophila để có được sự hiểu biết sâu hơn và sâu hơn về sinh lý, di truyền và như vậy. Người AI viết máy tính chơi cờ để ngày càng giỏi hơn trong việc chơi cờ. Điều này không dạy chúng ta nhiều về khoa học máy tính; nó sẽ giống như các nhà sinh học nhân giống drosophila siêu nhanh, siêu mạnh và khiến chúng chiến đấu với nhau.
David Richerby

WRT ẩn dụ, đó là hình dung hơn "ruồi giấm của trí tuệ nhân tạo" wrt khía cạnh khác nhau, đặc biệt là xem xét nó didnt dứt khoát đánh bại con người hàng đầu cho đến ~ 1997, & nghiên cứu nó tiếp tục, vv
vzn

Câu trả lời:


16

Toàn bộ không gian nhà nước cho cờ vua là rất lớn - có thể ước tính khoảng 10 43 (số Shannon (Shannon, 1950) , ( Wikipedia )).

Ý tưởng bạn trình bày - Các tác nhân Học tập Củng cố chơi với nhau để tìm hiểu trò chơi - đã được áp dụng thành công cho Backgammon - TD-Gammon (Tesauro, 1995) , ( Chương về Học tăng cường của Sutton & Barto ). Nó cũng sử dụng Mạng nơ-ron để ước tính hàm giá trị của trò chơi. Tuy nhiên, vấn đề này đơn giản hơn nhiều, vì số lượng trạng thái trong Backgammon nhỏ hơn đáng kể so với trong cờ vua, cụ thể là: 18,528,584,051,601,162,496 ( chủ đề Lưu trữ diễn đàn Backgammon ).

Tuy nhiên, nếu bạn kết thúc trò chơi sau một vài động tác ban đầu và chỉ nhằm mục đích học "mở tốt", bạn có thể thành công với phương pháp tương tự. Vấn đề chính là đánh giá trò chơi sau khi mở trò chơi, điều này có vẻ khó. Chỉ là một biện pháp tương tự với các vị trí đã thiết lập sau khi mở nổi tiếng là không đủ, bởi vì vị trí có thể cách xa họ nếu đối thủ sẽ thực hiện một động thái ngu ngốc (vì vậy sẽ không phải do lỗi của tác nhân học tập, vì vậy vị trí ngay cả khi "không chính xác "Nên được đánh giá là một kết quả tốt).

Người giới thiệu:


1
Phần khó nhất thực sự là đưa ra một cách thực nghiệm để ghi kết quả của các lần mở. Các cách mở khác nhau là tốt theo những cách khác nhau, vì vậy có lẽ có vô số các lỗ mở được chấp nhận.
JDong

3

Tôi khá chắc chắn rằng bất kỳ phương pháp AI hoặc ML có thể (hoặc kỳ lạ) nào trong sách giáo khoa đã được thử và thất bại khá nhiều so với lực lượng vũ phu đơn giản.

Quan điểm cá nhân của tôi là cờ vua không còn quan tâm đến AI hiện đại nữa ... Đơn giản, bởi vì nó đã được giải quyết : chỉ bằng cách sử dụng một máy tính hiện đại và vũ lực. Vì vậy, tôi không cảm thấy cần phải tạo ra một hệ thống "thông minh" để giải quyết nó hiệu quả hơn (hoạt động tốt trong điện thoại di động của tôi) và tôi tin rằng thậm chí không cần một số thứ chưa biết và hơn thế nữa Cách tiếp cận "thông minh" để tồn tại.


1
Tôi không chắc tại sao điều này lại bị hạ thấp. Lập luận rằng cờ vua được "giải quyết" là một chút không chính xác, trong đó không có máy tính có thể nhìn vào bất kỳ vị trí có thể và đánh giá nó một cách hoàn hảo. Điều đó nói rằng, iliasfl nhận thấy rằng cờ vua đã mất phần lớn sức hấp dẫn của nó đối với nghiên cứu AI. Đối với một điều, các chương trình cờ vua máy tính tốt nhất bây giờ mạnh hơn rất nhiều so với con người tốt nhất, được cung cấp đủ sức mạnh xử lý và thời gian. Điều này làm cho các lập trình viên ngày càng khó khăn hơn trong việc đánh giá một thuật toán hoạt động tốt như thế nào.
elixenide

1
Cảm ơn, tôi đã nói giải quyết theo nghĩa là vũ phu là một giải pháp. Tất nhiên cộng đồng AI (nói chung không chỉ ở đây) không hài lòng với "giải pháp" đó. Tuy nhiên, chúng tôi đã có một hệ thống tính toán thể hiện hành vi "thông minh" để giải quyết nhiệm vụ này và thậm chí giành được con người tốt nhất, theo thời kỳ. Cá nhân, tôi tin rằng cờ vua sẽ lạc đề đối với AI sau một vài năm khi hàng loạt các học giả hiện nay đã dành sự nghiệp để tấn công nó đã nghỉ hưu.

Tôi sẽ không gọi các triển khai cờ vua máy tính hiện tại là 'giải quyết bằng vũ lực' - họ vẫn đang tìm kiếm số lượng lớn các trò chơi, nhưng có nhiều thành phần của lực lượng không vũ phu ở đó. Tất nhiên, chúng không phải là một giải pháp "kiểu con người" có thể khái quát tốt cho các vấn đề khác, nhưng tôi sẽ không ngạc nhiên rằng nếu chúng ta có một AI cờ vua "kiểu người", thì nó sẽ ít hơn nhiều bậc hiệu quả hơn các giải pháp chuyên ngành hiện tại, làm cho nó đơn giản là kém hơn.
Peteris

Tôi nghĩ rằng câu trả lời này và các nhận xét của nó đã bị từ chối khá rõ ràng bởi Alpha Alpha của Google: en.wikipedia.org/wiki/AlphaZero Ngay cả khi bạn chấp nhận những lời chỉ trích về thiết lập cho Stockfish và họ đã rút ra tất cả các trận đấu, một hệ thống đã đạt đến mức đó với một vài giờ đào tạo rõ ràng là vượt trội.
Kamal

2

Tôi nghĩ rằng đáng lưu ý rằng để xác định cách giải quyết vấn đề AI, bạn phải xác định nó. Cho dù đó là hoàn toàn có thể quan sát được hoặc một phần có thể quan sát được , và cho dù đó là quyết định hay ngẫu nhiên / cơ hội.

Cờ vua hoàn toàn có thể quan sát được, (chẳng hạn như Backgammon, Monopoly hoặc Poker chẳng hạn) Nó cũng mang tính quyết định (ví dụ như Cờ đam và cờ vây) Cuối cùng, đối thủ tồn tại và vì khi xác định nước đi tốt nhất tiếp theo, nên sử dụng loại Tìm kiếm đối nghịch tốt nhất các thuật toán như MiniMax. Phân loại một vấn đề có thể giúp chúng tôi xác định loại thuật toán tìm kiếm nào chúng tôi muốn áp dụng. Và trong trường hợp cờ vua, Tìm kiếm nghịch cảnh sẽ phù hợp.

Minimax nói riêng có một

Ôi(bn)

Ôi(bm)

Vì vậy, trong trường hợp cờ vua, b sẽ là 35 và m sẽ là 100 Có nhiều cách xung quanh nó hoặc các chiến lược để làm cho nó hiệu quả hơn, như cắt bỏ alpha-beta.


Cũng đáng chú ý trong bối cảnh này, rằng các trò chơi kết thúc cho cờ vua cho đến vài quân cờ đã được lập bảng - một sự tối ưu hóa hơn nữa.
BartoszKP

Đây là cách tiếp cận thông thường nhưng không phải là phương pháp học máy. Câu hỏi sử dụng thẻ Machine-learning.
Lyndon White

@Oxinabox mặc dù điều đó là đúng, nhưng người hỏi không đề cập đến nơi nào trong tiêu đề hoặc cơ thể mà anh ta quan tâm đến phương pháp học máy, chỉ cuối cùng anh ta chia sẻ một ví dụ về cách tiếp cận mà anh ta có trong đầu. Không cần hạn chế vấn đề đối với Machine Learning, cũng không phải là một thuật toán học đơn lẻ (NN).
Iancovici

Thật vậy, điều này là tốt
Lyndon White

nói chính xác, cờ vua không thể quan sát được hoàn toàn, vì đã đưa ra một vị trí mà chúng ta không biết, chẳng hạn, có một vị vua hay một tay đua đã di chuyển hay không, mặc dù điều đó rất quan trọng đối với việc tạo di chuyển (vẫn có thể sử dụng phép đúc?), nhưng một lập trình viên có thể làm cho nó hoàn toàn có thể quan sát được bằng cách thay đổi vị trí đại diện khác biệt giữa vua / rook không di chuyển và king / rook di chuyển như một con số khác, mặc dù nó có thêm một số khó khăn.
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.