Trong ánh sáng của giải đấu TCEC đang diễn ra, tôi đã nghĩ, làm thế nào để họ đưa ra xếp hạng của các máy tính này? Có lẽ, một công cụ cờ vua được xếp hạng 2000 sẽ mong đợi số điểm khoảng 0,5 so với một người được xếp hạng 2000. Điều này có thể giúp dễ dàng xác minh xem các công cụ cờ vua có thực sự xấp xỉ mức đánh giá mà họ nói hay không. Tuy nhiên, đây là vấn đề đối với các chương trình được đánh giá cao hơn như komodo, người được cho là khoảng năm 3250. Rõ ràng, không có con người nào chơi ở cấp độ này. Hơn nữa, thậm chí 2800 máy tính được xếp hạng không chơi với con người (tôi nghi ngờ Magnus chơi với máy tính để giúp các nhà phát triển xác định xếp hạng của họ). Thậm chí còn đáng ngờ nếu động cơ chơi với các đại kiện tướng để xác định sức mạnh của họ. Vì vậy, tôi nghi ngờ rằng những xếp hạng động cơ này được xác định bởi các động cơ chơi đối thủ có sức mạnh tương tự từ lâu, và hầu hết các đánh giá đến từ các trò chơi động cơ và động cơ những ngày này. Nhưng nếu điều này là đúng, tôi sẽ không hy vọng rằng xếp hạng động cơ là chính xác so với thang đo elo của con người. Có cách nào họ kiểm tra xếp hạng động cơ là chính xác không?