Động cơ giống con người để đào tạo endgame


10

Tôi đang thực hiện đào tạo endgame với LucasChess (LC), nhưng vấn đề không thực sự liên quan đến LC, mà nói chung với động cơ cờ vua nói chung.

Tôi có vấn đề này: Xem hình. Khi tôi di chuyển Kh6 ở vị trí này, động cơ trong LC di chuyển Ke8. Có lẽ đây là động thái mà màu trắng cần nhiều di chuyển nhất cho đến khi giao phối.vị trí: w: Kh5, PG6, PG4, b: Kf8, màu trắng để di chuyển

Nhưng nó cũng là động thái làm cho mọi thứ dễ dàng cho màu trắng. Sẽ khó hơn cho màu trắng nếu màu đen sẽ di chuyển Kg8, cố gắng chặn cầm đồ cho đến khi không còn có thể và có thể gây ra bế tắc. Thay vì chặn, màu đen chạy về hướng trung tâm.

Tôi cho rằng động cơ thấy rằng với việc chạy trốn đến trung tâm, nó có thể là một người bạn đời ở độ tuổi 20 và không chạy trốn và cố gắng ngăn chặn nó có thể là một người bạn đời trong 16. Vì vậy, nó làm cho việc di chuyển "tối ưu" trong đó khoảng cách với bạn đời là dài nhất .

Nhưng đây không phải là động thái tốt nhất của con người. Bởi vì nó làm cho màu trắng dễ dàng hơn để trở thành nữ hoàng của nó. Nó xóa tất cả các khả năng cho màu trắng để phạm sai lầm và theo cách này, nó lấy đi một phần quan trọng của hiệu ứng đào tạo.

Tôi đã thấy hành vi này trong gần như tất cả các kết thúc cầm đồ, không chỉ điều này; và cũng trong các kết thúc khác.

Tất cả các công cụ tôi đã thử cho thấy hành vi này. (Komodo, Cá kho, mòng biển, Gaviota, trái cây)

Vì vậy, câu hỏi của tôi là: Bạn có biết một công cụ miễn phí hoặc một số cài đặt cho một công cụ chơi kết thúc giống như con người, cố gắng chặn những con tốt nhất có thể thay vì chạy trốn cùng nhà vua đến trung tâm không?

Cập nhật: konsolas tìm thấy một động cơ (Leela hoặc Lc0) mà xử lý các vị trí nhất định tốt và như vậy tại tôi lần đầu tiên được chấp nhận câu trả lời của mình như là các câu trả lời. Ở giữa tôi đã thử nghiệm Lc0 nhiều hơn và đi đến kết luận rằng nó hoàn toàn không thể sử dụng được cho việc đào tạo kết thúc, bởi vì nó chơi hầu hết các kết thúc một cách thảm khốc. Khi chấp nhận câu trả lời, tôi thậm chí không thể tưởng tượng được bất kỳ động cơ nào chơi trò chơi quá tệ.

Vì vậy, tôi muốn làm rõ câu hỏi của mình: Bạn có biết một công cụ miễn phí hoặc một số cài đặt cho một công cụ, với Movetime 1 hoặc thấp hơn, mà không cần thẻ đồ họa, chơi trò chơi giống như con người, cố gắng chặn những con tốt nhất có thể thay vì Chạy trốn cùng nhà vua đến trung tâm?

Lc0 với lưới hiện tại hoặc lưới chưng cất của dkappe không đủ điều kiện, bởi vì những trò chơi này hầu hết đều kết thúc khủng khiếp và hoàn toàn không giống con người trên PC mà không có card đồ họa. Và từ tất cả những gì tôi đã đọc một card đồ họa thậm chí sẽ không giúp ích gì cho trò chơi kết thúc của nó.

Cập nhật 2: Tôi muốn làm rõ rằng đó không chỉ là vị trí trên mà còn rất nhiều người khác nữa. Động cơ chơi di chuyển làm cho khoảng cách để giao phối lớn nhất, giả định chơi hoàn hảo của đối thủ. Ví dụ 8/8/8 / 6K1 / 8/8 / 3Q2kp / 8 b - - 4 9, xem hình thứ hai. Động cơ chơi Kf3, điều này giúp cho W. rất dễ chơi. B nên chơi gì là Kg1, và bây giờ W khó hơn nhiều để giành chiến thắng. Sau đó, W cần phải biết hoặc thấy rằng anh ta phải cho phép B trở thành nữ hoàng.8/8/8 / 6K1 / 8/8 / 3Q2kp / 8 b - - 4 9


2
Vấn đề tương tự đôi khi xảy ra khi thực hành chiến thuật trên lichess. Thông thường, động cơ sẽ không chơi phòng thủ thử nghiệm nhiều nhất vì với cách chơi tốt nhất, nó kém hơn so với phòng thủ dễ bị bác bỏ.
Qudit

1
Không xúc phạm ... Nhưng 1.Kh6 Kg8 2.g7 khá đơn giản.
Jossie Calderon

@ Jossie C.: Có, nếu bạn biết loại vị trí, nếu bạn biết một trận hòa đang ẩn nấp đằng sau góc. Nhưng trong tư thế tương tự, (5k2 / 8 / 6P1 / 7K / 6P1 / 8/8/8 w - - 2 2) sau 1.Kh6, Kg8 mở ra khả năng cho White mắc lỗi g5? với vẽ. Nếu bạn biết rõ vị trí, bạn sẽ không phạm sai lầm. ... Nhưng sau đó, bạn cũng không cần phải đào tạo loại tư thế này. Nhưng nếu bạn muốn đào tạo vị trí này và bạn sẽ không bao giờ gặp phải trận hòa này trong quá trình đào tạo, bạn đã không học được nhiều. Tệ hơn nữa. sau đó bạn đã học được rằng không có gì để nhận thức ở đây.
Wickie

Phụ lục: (5k2 / 8 / 6P1 / 7K / 6P1 / 8/8/8 w - - 2 2) không phải là một pos tương tự, đó là pos ban đầu của tôi.
Wickie

1
Một cách để 'giải quyết' vấn đề này là buộc máy tính ngừng tìm kiếm ở độ sâu chỉ hơn một chút so với độ sâu tìm kiếm hiệu quả của chính bạn. Bằng cách đó, sẽ không thể bỏ lỡ một cái gì đó bạn có thể nhìn thấy, nhưng cũng sẽ không thực hiện một động thái vì một lý do chỉ có nó có thể nhìn thấy.
user21820

Câu trả lời:


5

Động cơ Alpha-beta, ở nhiều vị trí kết thúc, sẽ nhanh chóng tìm thấy bạn đời và do đó sẽ chọn động thái kéo dài thời gian giao phối lâu nhất.

Tuy nhiên, các động cơ sử dụng Monte Carlo Tree Search, chọn dòng có cơ hội chiến thắng / vẽ lớn nhất. Ví dụ: Lc0 , một công cụ mạng thần kinh sử dụng MCTS, gợi ý Kg8 như bạn muốn ở vị trí của bạn:

NN - NN
1 ... Kg8 2. Kh6 Kh8 3. Kg5 Kg7 4. Kf5 Kg8 5. Kf6 Kf8

Lc0 không chơi các trò chơi kết thúc cũng như các công cụ alpha-beta, nhưng nó có xu hướng chơi chúng theo cách thức của con người hơn nhiều.

Tôi cũng sẽ đề nghị xem qua Komodo 12 MCTS, cũng có thể thể hiện loại hành vi này.


Thật vậy, tôi đã sử dụng Lc0 với trọng lượng 36089 và nó chơi những trò chơi đó tốt hơn nhiều so với bất kỳ động cơ nào khác mà tôi đã thử (và tôi đã thử thêm hàng tá ở giữa). Mặt khác, nó không biết cách giao phối với KQ-Q. Vì vậy, nó có thể không phải là công cụ tốt nhất để đào tạo endgame. Tuy nhiên, câu hỏi ban đầu của tôi đã được trả lời.
Wickie

1
@Wickie KQ-Q là gì?
Pedro A

@Pedro KQ-Q là một sai lầm ở bên cạnh tôi. Ý tôi là KQ-K. Vua và Hoàng hậu chống lại Vua.
Wickie

2
Thế nào là bạn thậm chí nói về? Leela có thể giao phối 100% thời gian với một KQ vs K. Đó là khả năng để làm điều này trong hơn một năm: docs.google.com/spreadsheets/d/...
NoseKnowsAll

1
@NoseKnowsTất cả, nó có thể giao phối với KQ-K, nếu bạn có dây thần kinh để chờ 30 bước hoặc lâu hơn. Ít nhất là với cấu hình của tôi (không có card đồ họa, 1 giây di chuyển, bộ đôi lõi 2,4 GHz), tất cả các mạng tôi đã thử chơi khủng khiếp trong trò chơi cuối. Tôi đang bị chuột rút dạ dày bằng cách nhìn vào chúng. Tôi đã thử các mạng chưng cất 36089 và dkappes 11258-48x5, 11258-64x6 và 11258-80x7.
Wickie

1

Freechess.org có một bot gọi là endgamebot mà bạn có thể chơi.

Nó biết đến 6 người đàn ông kết thúc.


3
Nhưng nó có chơi giống con người không, đó là câu hỏi của OP?
Glorfindel

@Glorfindel: Vâng.
Jossie Calderon

@ Jossie Calderon: Tôi muốn dùng thử. Tôi đã có một tài khoản fics và BabasChess. Làm thế nào tôi có thể đào tạo một vị trí nhất định với bot này? ( trợ giúp bot hoặc trợ giúp endgamebot không có kết quả.)
Wickie

@ Jossie Calderon: Tôi đã tự mình tìm thấy nó: hãy nói với sự giúp đỡ của endgamebot
Wickie

2
@ Jossie Calderon: Nó không :-( Sau 1. Kh6, Kg8 mở ra khả năng cho g5 sai lầm trắng với bốc thăm Các endgamebot không chơi Ke7 đó, bỏ chạy điển hình đến trung tâm..
Wickie

0

Nó phụ thuộc vào LC công cụ cờ vua nào đang sử dụng, ngày nay các công cụ chơi rất giống với các kiểu di chuyển của con người, tải xuống stockfish 9 và đính kèm LC bạn sẽ làm những gì anh ta đang chơi. Ngoài ra còn có một điểm quan trọng, đôi khi ứng dụng đào tạo sử dụng các động tác được tích hợp để chơi, vì vậy hãy đảm bảo rằng công cụ đang phát và không chỉ trả lời các di chuyển từ ký hiệu


Tôi đã thử nhiều động cơ trong LC, tất cả đều cho thấy hành vi của vị vua đang chạy trốn. Ngoài Leela hoặc Lc0 có những thiếu sót khác.
Wickie
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.