Làm thế nào để một động cơ cờ vua bắt chước một đánh giá Elo


7

Tôi là một người chơi cờ khá mới (nói 1400) và tôi muốn đấu với Stockfish và giành chiến thắng một thời gian. Nếu tôi thay đổi cường độ thành 1400 thì thuật toán thực sự làm gì? Liệu nó có tạo ra những sai lầm ngẫu nhiên hay đơn giản là nó làm giảm độ sâu của nó và do đó chỉ nhìn thấy sự kết hợp chiến thuật dễ dàng nhất của các nước đi. Nếu vậy, độ sâu sẽ là bao nhiêu cho một đánh giá 1400?


4
Nếu nó làm điều đó, nó sẽ làm điều đó bằng cách cố ý (hoặc ngẫu nhiên) chọn các động tác xấu. Không ai trong số các động cơ làm điều này tốt. Nếu bạn muốn chiến thắng một số trò chơi, tôi khuyên bạn nên tham gia câu lạc bộ cờ vua địa phương và chơi con người.
Tony Enni

Stockfish xen kẽ giữa di chuyển ultrastrong và ultraweak khi được đặt ở mức thấp. Tôi nghĩ Shredder hoặc The Chess Crazy Bishop chơi ở cấp độ phù hợp hơn ở cấp thấp hơn của Elo. Các công cụ được xếp hạng thấp từ CCRL cũng có thể phù hợp hơn.
Một người qua đường

Câu trả lời:


6

Trong chế độ giảm sức mạnh, Stockfish bắt đầu một pv đa nơi động cơ tìm kiếm nhiều hơn một động tác tốt nhất. Khi động cơ cần thực hiện một động tác, nó sẽ tìm kiếm tất cả các khả năng trong các động tác đa pv và chọn một động tác với thuật toán sau:

  1. Lọc ra một động thái nếu đó là một sai lầm thô. Nó làm điều đó bằng cách so sánh điểm số của nó với một điểm số đa pv khác.
  2. Tạo một số ngẫu nhiên nhỏ và áp dụng nó cho điểm nhiều pv
  3. Chọn di chuyển nếu điểm số được chuyển đổi là tốt nhất

Nghe có vẻ phức tạp nhưng không phải vậy, hãy làm một ví dụ.

Nói, tôi đã trao đổi nữ hoàng của tôi với bạn. Bạn có thể đưa nữ hoàng của tôi với giám mục hoặc cầm đồ của bạn. Nếu bạn đã làm điều đó với giám mục của bạn, vị trí sẽ bằng nhau. Nếu bạn đã làm với cầm đồ của bạn, vị trí cầm đồ của bạn sẽ bị hủy hoại và dẫn đến một vị trí hơi kém. Nếu bạn làm bất cứ điều gì khác, tôi sẽ là một nữ hoàng phía trước.

Một điểm có thể sẽ là:

  • BxQ -> 0,00
  • PxQ -> -0,34
  • Kh8 -> -9,99

Không lấy lại nữ hoàng là một sai lầm thô thiển và nên tránh bất cứ khi nào có thể. Khi áp dụng cho thuật toán:

Phép tính

    1. Động cơ xem xét BxQ

Điểm số tốt nhất là 0,00. Vì đây là động thái đầu tiên, không có gì để làm.

    1. Động cơ xem xét PxQ

Lưu ý rằng nếu không cho PxQ di chuyển một mức tăng ngẫu nhiên nhỏ, sẽ không bao giờ được chọn vì điểm tốt nhất (0,00) lớn hơn điểm cho PxQ (-0,34).

Stockfish tạo ra một số dương nhỏ và thêm nó vào PxQ. Bây giờ, có hai khả năng. Nếu số ngẫu nhiên quá nhỏ, giả sử là 0,10, điểm số được thêm vào (-0,34 + 0,10 = -0,24) vẫn còn quá nhỏ so với điểm số tốt nhất (0,00) và nó đã bị loại bỏ. Nếu số ngẫu nhiên được tạo ra đủ để đẩy điểm PxQ lên trên điểm số tốt nhất, ví dụ: 0,40. Điểm mới cho PxQ sẽ là 0,06 và lớn hơn 0,00. Do đó, Stockfish sẽ chọn PxQ.

    1. Động cơ xem xét Kh8

Không lấy lại nữ hoàng là một sai lầm thô thiển. Sự khác biệt giữa nó với di chuyển trước đó là quá lớn (-9,99 - -0,34). Stockfish sẽ không xem xét nó, và loại bỏ nó ngay lập tức.

Hàm ý

  • Động cơ sẽ không chơi cờ ngẫu nhiên
  • Khả năng thực hiện một di chuyển kém hơn phụ thuộc vào máy phát ngẫu nhiên. Sự hữu ích của máy phát điện cũng phụ thuộc vào mức độ sức mạnh. Bạn hỏi Stockfish càng yếu, máy phát điện càng tạo ra số lượng lớn hơn.
  • Những sai lầm ngớ ngẩn được tránh
  • Động thái Stockfish chơi là không thể đoán trước, mô phỏng hành vi không thể đoán trước của con người.
  • Stockfish không bắt chước đánh giá Elo. Nó chỉ cung cấp cho bạn 20 cấp độ sức mạnh.

Đã chỉnh sửa

Người đăng đã quan tâm đến một liên kết đến Stockfish cho iOS trong các bình luận. Xin lưu ý rằng tuyên bố trong liên kết "Đặt cường độ của động cơ theo thang điểm từ 0 đến 2500. Thang đo này tương ứng với thang đo ELO của con người. 0 là trò chơi hoàn toàn khủng khiếp, trong khi 2500 là sức mạnh tối đa."là sai lệch và đơn giản là sai. Để xem tại sao, trang này không được viết bởi nhà phát triển động cơ Stockfish. Người viết đã giải thích sai về tỷ lệ được báo cáo trong ứng dụng. Trong thực tế, nếu bạn cung cấp cho ứng dụng, giả sử Elo 2000, ứng dụng sẽ ánh xạ nó tới một trong 20 cấp độ sức mạnh. Bất cứ xếp hạng Elo nào bạn thấy trong ứng dụng hoàn toàn không có ý nghĩa gì, đó chỉ là một cách dễ dàng để người dùng cuối điều chỉnh các cấp độ. Không có mối quan hệ trực tiếp giữa mức độ sức mạnh với xếp hạng Elo. Hãy nghĩ như thế này, nếu tôi sửa đổi mã nguồn và mở rộng phạm vi từ 0,20 đến 0,40. Bây giờ khi bạn chọn thế mạnh 30, đánh giá là gì? Tôi có thể nói với bạn đó là Elo 2400, hoặc Elo 2500 hoặc Elo 3500.

Vào cuối ngày, Stockfish không bắt chước sức mạnh của Elo. Các nhãn Elo mà bạn thấy trong ứng dụng chỉ đơn giản là các nhãn đẹp giả vờ có mối quan hệ.


2
Cảm ơn. Nếu bạn nhìn vào đây support.stockfishchess.org/kb/ios-app/ trộm thì nó nói rằng "Đặt sức mạnh của động cơ theo thang điểm từ 0 đến 2500. Thang đo này tương ứng với thang đo ELO của con người. 0 là một trò chơi hoàn toàn khủng khiếp, trong khi 2500 là sức mạnh tối đa "
Dom

Xem câu trả lời chỉnh sửa của tôi.
SmallChess

1
Câu trả lời đơn giản: những gì bạn thấy trong liên kết không chính xác.
SmallChess

Hơn nữa, bạn có thực sự tin rằng Stockfish chỉ thực hiện tối đa Elo 2500? Đó là một động cơ mạnh hơn nhiều.
SmallChess

1
Tôi không có niềm tin về Stockfish. Tôi chỉ đơn giản là báo cáo những gì được viết trong trang web hỗ trợ của họ (liên kết từ trang web stockfish chính).
Dom

0

Nếu bạn muốn có một đối thủ máy tính "thân thiện", một số gói có sẵn cung cấp khả năng "spar", trong đó họ sẽ đánh giá các bước đi của bạn và tạo ra một đánh giá cho bạn theo cách đó. Sau đó, họ sẽ điều chỉnh cách chơi của họ thành (khoảng) ở cấp độ của bạn.

Fritz, ví dụ, có nhiều phương pháp "lúng túng" như vậy, bao gồm

  • " Bạn bè chế độ" (mà cư xử như tôi đã mô tả),
  • " Sparring " chế độ, trong đó chương trình đôi khi thực hiện sai lầm chiến thuật, với 3 cấp độ chơi, trong đó có một tùy chọn "cảnh báo" tính năng để khuyến khích bạn tìm kiếm một sai lầm như vậy
  • " Chế độ cược chấp và chế độ vui nhộn ", trong đó bạn điều chỉnh các biến ảnh hưởng đến việc chơi, chẳng hạn như sức mạnh chơi (họ nói trong ELO pts, nhưng xem ở trên), thiên vị mảnh, an toàn vua, xu hướng tấn công, v.v.

Lưu ý rằng nhận xét của tôi về Fritz là dành cho phiên bản 9 và hiện tại họ đã 15 tuổi, vì vậy có lẽ hơi khác một chút.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.