Có một động cơ nào tìm thấy bước di chuyển thực tế tốt nhất của thành phố không?


25

Một động cơ cờ tiêu chuẩn sẽ tìm thấy nước đi mà nó cho là tốt nhất giả định chơi tốt nhất từ ​​cả hai bên. Nhưng động thái này có thể dẫn đến một lợi thế không đáng kể hoặc một đường khó có thể dễ dàng dẫn đến sai lầm cho một người chơi có khả năng cụ thể. Có một chương trình tìm thấy động thái "thực tế" tốt nhất cho người chơi trung gian không? Ví dụ, nó có thể chọn một nước đi dẫn đến một vị trí tấn công rất mạnh, nơi đối thủ rất có thể sẽ phạm sai lầm, mặc dù nó có thể được bảo vệ chống lại với lối chơi hoàn hảo.


5
Câu hỏi rất thú vị, nhưng tôi nghĩ việc thực hiện một cái gì đó như thế này có thể khó khăn vì "thực tế", có thể rất khác nhau tùy thuộc vào tình huống. Ví dụ, liệu động thái tương tự có thực tế như nhau trước đối thủ 200 điểm trên và 200 điểm dưới đây không? Thế còn game cổ điển so với game blitz?
Akavall

Có vẻ như bạn muốn một cái gì đó gần vớiimimimax hơn minimax?
Mehrdad

Điều này làm tôi nhớ đến poker. Tôi nghĩ rằng hầu hết các pokerbots luôn chơi các động tác thực tế thay vì giả định trạng thái cân bằng Nash và cố gắng chơi các động tác tốt nhất về mặt lý thuyết.
Paul

Một cách để nghĩ về điều này là bạn đang tìm cách định lượng một hàm mục tiêu khác. Khi bạn thua, bạn không muốn giảm thiểu số tiền bạn mất (ai quan tâm nếu bạn thua bởi một con rết hoặc một nữ hoàng). Thay vào đó, bạn muốn giảm thiểu số tiền bạn mất, theo đó vẫn là một đường mà đối thủ của bạn có thể rơi vào một cách hợp lý. Bạn có thể định lượng "hợp lý rơi" bằng cách đếm "chỉ" di chuyển hoặc tình huống trong đó chỉ di chuyển hàng đầu (hoặc hai) tiếp tục lợi thế của họ, nhưng các động thái khác dẫn đến lợi thế của bạn.
ddunn801

Tương tự như vậy, trong bóng đá Mỹ, bạn đá chính vì nó mang lại cho bạn cơ hội (mỏng) để ghi bàn nhanh chóng mặc dù kết quả được mong đợi sẽ khiến bạn trở nên tồi tệ hơn.
ddunn801

Câu trả lời:


22

Bạn đang mô tả một cái gì đó rất giống với sự khinh miệt . Ý tưởng với sự khinh miệt là nếu bạn giữ sự năng động hơn ở vị trí này, một đối thủ yếu hơn có nhiều khả năng mắc sai lầm mà sau đó bạn có thể khai thác. Do đó, với hai động tác mang lại sự tương tự, một động cơ có điểm khinh miệt cao sẽ chọn động cơ giữ được sự năng động hơn ở vị trí này. Các động cơ truyền thống mạnh nhất hiện nay đều có sự khinh miệt được thực hiện (ví dụ cho Komodo ).

Nguy cơ của sự khinh miệt là, chống lại một đối thủ mạnh, sự khinh miệt cao có thể khiến bạn bị giết - sau tất cả, bạn buộc động cơ phải chơi một động tác yếu hơn chỉ để giữ cho trò chơi được sống.


1
Cảm ơn, điều đó tương tự với những gì tôi đang tìm kiếm, nhưng câu hỏi của tôi thậm chí là dành cho những người chơi có cùng khả năng. Ví dụ: một động tác có thể dẫn đến chiến thắng 9/10 lần khi xem xét khả năng di chuyển mà đối thủ sẽ thực hiện.
Ari

3
@Ari nó tương tự mặc dù. Thực hiện hai động tác, một trong số đó sẽ dẫn đến một trận hòa và cái còn lại có thể dẫn đến chiến thắng 90% thời gian và mất 10% thời gian còn lại. Một động cơ có cài đặt khinh miệt rất cao có thể chọn cái sau (và thua trước phòng thủ hoàn hảo).
Allure

1
Nếu không có động cơ khinh miệt có lẽ sẽ thu hút hầu hết các trò chơi chống lại các đối thủ kém hơn bằng cách không loại trừ sự lặp lại bắt buộc tại bất kỳ điểm nào.
Vô minh quán tính

1
Có thể rất tốt nếu người chơi khác sắp hết giờ trên đồng hồ của họ.
Ian Ringrose

@Ari Nếu đối thủ của bạn ngang hàng với bạn, thì nếu bạn có thể phân tích tổng hợp một dòng (nghĩa là không chỉ quyết định liệu nó có chiến thắng hay không, mà còn ước tính khả năng đối thủ của bạn sẽ thấy rằng nó chiến thắng), sau đó họ sẽ Có lẽ sẽ có thể phân tích về nó.
Tích lũy

6

Tôi nhận ra câu hỏi này áp dụng chủ yếu cho các động cơ cờ tiêu chuẩn sử dụng các hàm minimax để đánh giá các nước đi. Tuy nhiên, các công cụ cờ vua như alphazero sử dụng tìm kiếm cây monte carlo để mô phỏng nhiều trò chơi khác nhau để họ không chỉ nhìn vào những nước đi tốt nhất có thể. Có thể là họ đã có thể được sử dụng để tìm ra động thái "thực tế" nhất, hoặc họ có thể được điều chỉnh cho mục đích đó. Ví dụ, thuật toán tìm kiếm monte carlo có thể được cập nhật để xem xét các động thái "hợp lý" và mô phỏng những gì xảy ra.



Nhưng sau đó bạn phải lập trình "hợp lý" vào thuật toán.
Vô minh quán tính

1

Không hẳn vậy.

Cơ sở dữ liệu rất hữu ích vì chúng có thể cho bạn biết thường xuyên di chuyển và kết quả là gì tuy nhiên chúng không hoàn hảo vì nhiều lý do.

Fritz 12 (không chắc chắn về các phiên bản sau) có đồng hồ "độ nóng" cho bạn biết mức độ phức tạp của biến thể.

Dòng dưới cùng. nó là sự kết hợp của nhiều thứ Bạn đang tìm kiếm những động thái trong đó những động thái nguyên tắc nhất trở nên tồi tệ. Không có động cơ có thể cho bạn biết rằng.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.