Tại sao một nước cờ có thể cải thiện cơ hội chiến thắng, theo máy tính?


14

Khi xem cốc Sinquefield trên http://grandchesstour.org/ , có thể thử các động tác khác nhau và xem máy tính đánh giá thế đứng sau động tác được đề xuất của bạn.

Bây giờ, hầu hết các di chuyển sẽ làm giảm vị trí của bạn, nếu nó không được coi là di chuyển tốt nhất của máy tính. Nhưng đối với một số di chuyển (khá thường xuyên), bạn ngay lập tức có cơ hội chiến thắng tăng lên, có thể là một nửa lợi thế cầm đồ. Tôi không hiểu điều này: Nếu một nước đi duy nhất có tiềm năng cải thiện đáng kể vị trí của người chơi, thì điều này có nên được phản ánh trong trạng thái hiện tại trước khi di chuyển không? Trong tâm trí của tôi, bất kỳ động thái nào không được coi là di chuyển tốt nhất của máy tính, sẽ dẫn đến một vị trí bị suy giảm, trong khi di chuyển tốt nhất chỉ nên giữ tư thế đứng, không thực sự cải thiện vị trí của người chơi. Bởi vì, nếu máy tính biết động thái này sẽ cải thiện vị trí người chơi, thì nó đã ở vị trí hiện tại để cải thiện vị trí người chơi, nói rằng "với cách chơi tốt nhất, bạn sẽ là một nửa cầm đồ"?

Hmm, hoặc có lẽ đây chỉ là kết quả của cách trang web được triển khai tại grandchesstour.org?


4
Trong một số trường hợp, động cơ gặp khó khăn khi tìm đúng di chuyển nhưng đánh giá chính xác khi bạn nhập thủ công. Điều này không phổ biến như những gì bạn đang mô tả mặc dù.
11684

Câu trả lời:


26

Nếu máy tính có khả năng đánh giá mọi dòng chơi cho đến hết trò chơi, việc đánh giá sẽ không bao giờ thay đổi. Thật vậy, việc đánh giá mọi di chuyển sẽ là "thắng", "thua" hoặc "hòa". Đây thực chất là những gì xảy ra trong các bảng cuối trò chơi. * Nếu máy tính có thể làm điều này cho mọi vị trí, mọi trò chơi đối với máy tính sẽ bao gồm máy tính từ chức mà không di chuyển, cung cấp cho bạn một vị trí ban đầu hoặc bị làm phiền rằng bạn đã từ chức hoặc chấp nhận đề nghị rút thăm đó.

Tuy nhiên, máy tính không thể đánh giá được điều đó bởi vì nó sẽ mất nhiều thời gian, bởi vì các trò chơi có thể rất dài (hàng trăm bước, theo nguyên tắc) và bởi vì có nhiều khả năng ở mỗi lần di chuyển. Vì vậy, máy tính phải có một số phím tắt. Điều này bao gồm cố gắng tìm ra cách nhanh chóng các ứng cử viên quan trọng nhất là gì thay vì tìm kiếm nhiều hơn để cố gắng tìm hiểu xem vị trí kết quả có tốt hay không.

Vấn đề là những phím tắt có thể đi sai. Máy tính có thể quyết định rằng việc treo một mảnh là xấu khi nó thực sự là một sự hy sinh thiên tài. Nó có thể quyết định rằng một vị trí đã ổn định khi thực sự nó không có. Nó có thể không đủ sức mạnh để nhìn đủ xa vào tương lai để thấy điểm thực sự của một động thái cụ thể.

Đây là một ví dụ đơn giản, mặc dù nó không còn thực tế nữa. Giả sử bạn sắp kiểm tra tôi nhưng tôi có một loạt mười kiểm tra tôi có thể thực hiện để trì hoãn bạn. Nếu tôi chỉ nhìn trước mười bước, tôi sẽ nghĩ mình vẫn ổn: có lẽ tôi thậm chí còn cầm đồ, vì vậy đánh giá của tôi là "Sau mười lần di chuyển, tôi vẫn là một con tốt, vì vậy tôi tốt . Điểm +1 "Tôi chơi séc đầu tiên của tôi, bạn trả lời, và bây giờ tôi thấy rằng đó là người bạn đời trong mười và từ chức. Đây là cái gọi là "hiệu ứng đường chân trời" mà các chương trình hiện đại cố gắng tránh (ví dụ, bằng cách nhìn sâu hơn dọc theo các đường có nhiều bước di chuyển bắt buộc) nhưng nó minh họa cho nguyên tắc chung.

Nếu động cơ có thể nhìn thấy, giả sử, mười di chuyển vào tương lai, thì nó sẽ nhìn xa hơn vào trò chơi khi mỗi lần di chuyển được thực hiện. Ở vị trí ban đầu, nó có thể thấy bảng sẽ trông như thế nào khi di chuyển 10; Sau một lần di chuyển, nó có thể thấy di chuyển 11 và cứ thế. (Một lần nữa, đây là một sự đơn giản hóa, vì máy tính ngày nay không tìm kiếm một khoảng cách cố định trong tương lai, nhưng nó mang lại cho bạn ý tưởng chung.)

Ví dụ bạn đã đưa ra chỉ là một phiên bản ít ấn tượng hơn của các ví dụ tôi đã đưa ra. Khi nhiều di chuyển được thực hiện, máy tính có thể nhìn sâu hơn vào trò chơi, do đó nó có thể đưa ra đánh giá chính xác hơn. Một cách khác để thấy điều này là về mặt thông tin: khi nhiều di chuyển được chơi, máy tính có nhiều thông tin hơn. Trước đây, người ta thường đoán xem phản ứng của bạn với 1.e4 sẽ như thế nào, nhưng bây giờ nó biết rằng bạn đã chơi Sicilia, v.v.


* Có một sắc thái nhỏ ở đây là bạn thực sự cần phải đếm số lần di chuyển để giành chiến thắng để tránh lặp lại các vị trí. Ví dụ, hãy xem xét kết thúc của KQ vs K. Mọi di chuyển không bế tắc hoặc đầu hàng nữ hoàng đều thắng, vì vậy bạn cần một cơ chế để lái về phía người chơi, thay vì chỉ di chuyển ngẫu nhiên và nói: "Wow, tôi hoàn toàn đi để giành được điều này - gần như mọi động thái đều thắng! "


Câu trả lời tuyệt vời! Tôi chưa bao giờ nghe về "hiệu ứng chân trời" đó, rất có ý nghĩa, rất thú vị.
Pedro A

Cảm ơn đã làm rõ. Tôi chủ yếu chìm trong sương mù về tác động lớn của một lần di chuyển, nhưng tôi đoán thời gian máy tính được phép phân tích là khá hạn chế trên trang web được đề cập, làm cho hiệu ứng lớn.
jonasfh

4

Không có sự không nhất quán. Khi bạn thực hiện di chuyển, máy tính không còn phải tìm kiếm vị trí trước đó. Bây giờ nó có thể tập trung tất cả sức mạnh xử lý vào vị trí mới, và do đó việc đánh giá có thể thay đổi. Cây trò chơi có thể rất khác nhau.

Điều này giống như cách chúng ta chơi cờ vua.


4
Bạn có thể nói thêm rằng công cụ cờ vua trực tuyến không phân tích nhiều bước di chuyển sâu để bắt đầu, vì vậy lớp bổ sung có ý nghĩa quan trọng hơn nhiều so với trên máy tính của bạn ở nhà.
Tháp Brian

Hmmm, tôi đồng ý. Tuy nhiên, tôi tò mò rằng tác động rất lớn cho một lần di chuyển. Tôi đoán máy tính sẽ phân tích khá quan trọng cho từng bước tiếp theo có thể, đặc biệt là những bước đi đầy triển vọng và nó sẽ khám phá xem liệu một trong những động tác có thể sẽ giúp cải thiện vị trí hiện tại và điều chỉnh trạng thái hiện tại phù hợp. Nhưng tôi thấy bình luận của Brian, điều quan trọng ở đây.
jonasfh
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.