Đánh giá máy tính: Làm thế nào đáng tin cậy?


14

Fritz 12 với Rybka đã cho một người bạn của tôi đánh giá +3 cho màu trắng ở vị trí kết thúc này ,

Trắng để di chuyển

mà hóa ra là một trận hòa. Nhưng tôi đã nghe rằng +3 từ máy tính có nghĩa là một chiến thắng được đảm bảo với lối chơi hoàn hảo. Có phải tôi vừa nghe nhầm? Đánh giá máy tính nên được giải thích như thế nào? Lợi thế mở của <.5 thậm chí có nghĩa là gì?


3
Tôi sẽ thách thức bình luận "chiến thắng được đảm bảo". Số đánh giá là một chỉ số heuristic, về cơ bản là một "cảm giác" mà máy tính dành cho vị trí. Endgame có thể có kết quả "đáng ngạc nhiên", và trừ khi máy tính đã được lập trình để phát hiện tất cả các mẫu có thể (hoặc nó có thể tính toán tất cả các cách), nó sẽ bỏ lỡ một số. Nhìn theo một cách khác, nếu +3 thực sự được đảm bảo, nó sẽ không phải là +3, nó sẽ là + vô cùng.
Daniel B

Đối với hồ sơ, tôi đã kiểm tra điều này với các bảng xếp hạng 7 mảnh của Lichess, và thực sự, đó là một trận hòa.
PhishMaster

Câu trả lời:


8

Có một vài điều ở đây.

Đầu tiên, mỗi chương trình sẽ có cách đánh giá vị trí riêng để điểm số không thể được so sánh trực tiếp. Ví dụ, tôi đã chạy StockFish chống lại Rybka gần đây và thấy điểm của Stockfish gấp đôi so với Rybka. Tôi đã rất ngạc nhiên về điều này, nhưng khá rõ ràng rằng điểm 1 không phải lúc nào cũng có nghĩa là "1 con tốt". Tôi nghĩ những gì chúng ta nên nhìn vào là điểm số thay đổi như thế nào. Một sự tò mò khác mà tôi thấy ngày hôm qua (trong khi trả lời một trong những câu hỏi khác của bạn, thật trùng hợp) là thuật toán đánh giá của Stockfish không giống như số lẻ rất nhiều. Trong thực tế, hầu hết các điểm là bội số của 0,04. Cho rằng độ lớn của giá trị là tùy ý, tôi sẽ không cho rằng bất kỳ giá trị nào đó có nghĩa là "một chiến thắng chắc chắn" trừ khi máy tuyên bố rằng nó đã tìm thấy bạn đời.

Thứ hai, bảng kết thúc trò chơi đã được tạo vì việc giải các trò chơi kết thúc đòi hỏi nhiều chiều sâu tìm kiếm. Máy tính chơi ở tốc độ giải đấu chỉ không làm tốt. Tôi đã làm việc thông qua một trò chơi khác vài ngày trước và thông báo trên trang này rằng một bên có lợi thế. Ed đã sử dụng một mặt bàn để cho thấy không còn bí ẩn nào ở vị trí này - nó đã được rút ra trên lý thuyết. Tất nhiên, có một sự khác biệt rất lớn giữa vẽ và chơi hoàn hảo; các cầu thủ phải tìm đúng nước đi.


Giá trị nhỏ thường được trao cho White trong giai đoạn đầu của trò chơi về cơ bản có nghĩa là màu trắng có thể yêu cầu bất động sản có giá trị hơn. Ví dụ, khi di chuyển 1, White có thể yêu cầu e4 và tấn công e5 và f5. Đen có thể phản. Nhưng sau đó White có thể chơi Nc3 và tấn công / tăng cường a4, b5, d5 và e4. Nhưng Đen có thể phản đòn. Vì vậy, nó có nghĩa là rất ít.


Cuối cùng, để trả lời câu hỏi trong dòng chủ đề của bạn - các đánh giá rất đáng tin cậy vì chúng dựa trên các sự kiện khó khăn và độ sâu tìm kiếm ấn tượng. Tất nhiên, máy móc không thể sai được. Nhưng người chơi b chúng ta phải nhớ rằng Stockfish (hoặc Rybka) chơi ở thế mạnh GM trên phần cứng khiêm tốn. Trên phần cứng phổ biến tốt nhất , họ ước tính xếp hạng của họ tại FIDE 3200. Điều này cao đến mức chỉ những người giỏi nhất mới có cơ hội không thua cuộc.

Xem xét điều này có nghĩa là gì; Tôi (USCF 1650-ish) có không có cơ hội chống lại một người (chẳng hạn, USCF 2050), người có không có cơ hội chống lại một người (chẳng hạn, USCF 2450), người có không có cơ hội chống lại một người (chẳng hạn, USCF 2850), người có một mảnh về cơ hội chống lại một chương trình thương mại hàng đầu (FIDE 3200).

Do đó, khi Stockfish nói rằng một động thái tốt hơn một động thái khác, tôi thường thực hiện theo mệnh giá. Khi tôi kết thúc các bảng kết thúc trò chơi, điều này sẽ bắt đầu thông báo về người bạn đời 30 tuổi, lol.


1
Phản ứng rất tốt đẹp. Tôi luôn nghĩ rằng việc đánh giá 1 có nghĩa là giá trị của 1 con tốt. Ngoài ra, chesstempo nói rằng (các) nước đi tốt nhất trong các vấn đề của nó là những nước giành được ít nhất 2 vật liệu có giá trị, vì vậy tôi đã xem xét đánh giá động cơ từ +2 trở lên để chiến thắng bất kể giai đoạn nào trong trò chơi. Tuy nhiên, tôi đã tìm thấy các phân tích về cá kho bị lỗi trước đây và thấy cách nó không đánh giá đúng các kết thúc. Trên lưu ý đó, bạn có biết nơi tôi có thể tìm thấy một bảng kết thúc của trò chơi không?
chubbycantorset

Đây là bảng cơ sở 6 người trực tuyến Ed đã đăng: k4it.de/index.php?topic=egtb&lang=en
Tony

+1 cho "Tôi sẽ không cho rằng bất kỳ giá trị nhất định nào có nghĩa là" một chiến thắng chắc chắn "trừ khi máy tuyên bố rằng nó đã tìm thấy bạn đời."
men

14

Các động cơ khác nhau có "thang đo" khác nhau cho các đánh giá số của chúng. Chẳng hạn, ở vị trí trung vệ điển hình còn nhiều người chơi, khi Houdini nói +2,00 hoặc tốt hơn, rất có khả năng Trắng có lợi thế chiến thắng (mặc dù ở đây tôi đã bao gồm trình độ vì một lý do). Nhưng hãy xem xét: người ta có thể sửa đổi mã nguồn của Houdini và nhân đôi giá trị tuyệt đối của tất cả các số liên quan đến các đánh giá; người ta có một động cơ có sức mạnh giống hệt nhau tạo ra lối chơi giống hệt nhau, nhưng bây giờ +4,00 có nghĩa là +2.00 được sử dụng để nói. Điều này minh họa rằng người ta không nên mong đợi một ngưỡng số thống nhất trên các động cơ thường biểu thị lợi thế chiến thắng.

Mặc dù vậy, điều quan trọng hơn là phải hiểu rằng việc đánh giá động cơ số của một vị trí (trái ngược với tuyên bố hoàn toàn về người bạn đời không thể tránh khỏi) không bao giờ dịch đúng thành "một trò chơi chiến thắng", ngay cả đối với một động cơ cố định duy nhất. Một điểm quan trọng là các đánh giá bằng số không có "ý nghĩa" rõ ràng trong các thuật ngữ cờ rộng, và thay vào đó chỉ là một thay thế cho suy nghĩ hữu cảm được sử dụng để hướng dẫn một cách cơ học một kết quả mong muốn bằng cách ảnh hưởng đến việc di chuyển nó chọn ở mỗi điểm trong tro choi; trong ánh sáng này, điều cuối cùng quan trọng nhất đối với trò chơi của động cơ chỉ là sự khác biệt trong đánh giá được gán cho các bước di chuyển tiềm năng, hơn là bất cứ điều gì về các giá trị tuyệt đốibị liên lụy. Các con số rất hữu ích cho chính động cơ, cần một thứ gì đó cụ thể để đưa ra quyết định cho người này chuyển sang người khác, nhưng con người chúng ta không nên quá nhanh để đọc thêm ý nghĩa về cường độ liên quan đến những suy nghĩ như "+ X nghĩa là một chiến thắng. "

Đặc biệt, chúng ta càng tiến xa hơn đến một trò chơi cuối cùng trái ngược với một trò chơi giữa, chúng ta càng ít sử dụng quy tắc ngón tay cái (như +2,00 của tôi cho Houdini ở giữa trận đấu ở trên) về một ngưỡng nhất định là đủ cho một chiến thắng. Một lý do chính cho điều này là những khó khăn mà các động cơ đã nhận ra các pháo đài, nơi có rất nhiều vật liệu bổ sung vẫn không đủ để giành chiến thắng. Chẳng hạn, khi tôi nuôi Stockfish vị trí này,

NN - NN

sau một vài phút nghĩ rằng nó sẽ đưa ra đánh giá khoảng +7.00, và ở một vị trí điển hình, khi Stockfish nói điều đó, bạn gần như chắc chắn có một chiến thắng trong tay. Tuy nhiên, đây là một trận hòa chết chóc và con người có thể dễ dàng nhận ra điều này một khi thực tế nhận ra rằng Đen chỉ có thể xáo trộn cuộc đua giữa f6 và h6, và vì vậy (1) cầm đồ h vô dụng, và (2) màu trắng vua sẽ không bao giờ có thể giúp nữ hoàng trắng tấn công. Cuối cùng , Stockfish cũng sẽ nhận ra một trận hòa ở đây, một khi nó chống lại 50 lần di chuyển, hoặc cuối cùng là hết các động tác khác nhau để thử và cuối cùng không thể tránh được sự lặp lại, nhưng những sự kiện đó đang đi xuống dòng độ sâu tìm kiếm.

Vị trí kết thúc từ câu hỏi trước đó của bạn mà bạn đã liên kết gần giống với loại pháo đài này, trong đó có thêm những con tốt được thông qua White có tất cả, nhưng cuối cùng không đủ để giành chiến thắng ở vị trí đó. Nếu một công cụ tính toán đủ thời gian để xem có nhiều thông tin như trong các bảng, thì đánh giá của nó sẽ giảm xuống 0, nhưng trong khi đó, thuật toán đánh giá của nó không có gì tốt hơn để đưa ra + cho điều đó tài liệu bổ sung (mà nó chưa biết là vô nghĩa).


+1 cho "Hơn thế nữa, điều quan trọng là phải hiểu rằng việc đánh giá động cơ số của một vị trí (trái ngược với tuyên bố hoàn toàn về người bạn đời không thể tránh khỏi) không bao giờ được chuyển thành một trò chơi chiến thắng"
đưa ra

8

Tôi nghĩ rằng hình ảnh này mô tả tình hình khá tốt. Nó được tạo ra từ 400k trò chơi và chỉ xem xét vật liệu đơn giản.

Giành xác suất / Lợi thế cầm đồ

Nguồn: Lợi thế cầm đồ, Tỷ lệ thắng và ELO


1
Đóng góp tốt đẹp! +1
men

@Thomas Ahle: Đồ thị rất thú vị. Nhưng bài viết gốc không còn nữa, liên kết wikispaces đã buồn bã đi xuống. Bạn có nhớ ý nghĩa chính xác của W = Win Xác suất không? Là nó thắng vs thua bỏ qua các trận hòa? Hay đó là "điểm số dự kiến" có tính đến các trận hòa?
Diedrsch

@Diedrsch Tôi đã cập nhật liên kết
Thomas Ahle
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.