Tại sao FIDE vẫn sử dụng Elo?


11

Tôi đã rất ấn tượng với cách hệ thống xếp hạng Glicko hoạt động. Đặc biệt:

  • Nhiều trò chơi được chơi gần đây khiến đánh giá của bạn ổn định
  • Ít trò chơi được chơi gần đây khiến xếp hạng của bạn dao động cho đến khi bạn nhận được một số trò chơi gần đây trong vành đai của mình

USCF đã sửa đổi hệ thống của họ tương tự vài năm trước (trong đó có thang trượt để khuếch đại hoặc làm giảm sự thay đổi xếp hạng cho một trận đấu nhất định), và bây giờ Glickman (nhà phát minh của Glicko) đang ở trong bảng xếp hạng cho USCF, Tôi tưởng tượng cuối cùng họ sẽ áp dụng một hệ thống thậm chí linh hoạt hơn, giống như hệ thống của mình.

Có một lý do nào khác (ngoài khả năng chống lại sự thay đổi, hoặc là họ chưa nhận được nó) mà FIDE không áp dụng một hệ thống xếp hạng chính xác hơn?

Câu trả lời:


9

Người ta không chứng minh rằng Glicko chính xác hơn. Glicko chỉ giải quyết vấn đề theo một cách khác, với một điểm nhấn khác. Hãy xem xét rằng tất cả các hệ thống này trừu tượng một tâm trí con người đến một số có 4 chữ số.

Có rất nhiều chính trị trong xếp hạng; đó là một chủ đề cảm động. Nếu FIDE chấp nhận nó, họ sẽ tạo ra một danh sách top 100 mới, và rất nhiều GM có thể sẽ buồn.

Hệ thống ELO rất dễ hiểu; minh bạch là quan trọng. Hệ thống phức tạp hơn có nhược điểm ngay lập tức.


6
+1, mặc dù tôi không đồng ý với đoạn đầu tiên, phần còn lại của nó là đủ đúng. 1) Glicko được chứng minh là trung bình chính xác hơn (tính theo mức độ thường xuyên có thể dự đoán ai sẽ thắng trong một trận đấu nhất định). 2) Về việc trừu tượng hóa tâm trí con người với một con số, đây không thực sự là vấn đề. Đó là thước đo kỹ năng, sao cho bạn có thể tính xác suất (để thắng / hòa / thua) khi so sánh các cấp độ kỹ năng. Tất cả đều được hỗ trợ bởi toán học và thống kê. Trong Glicko-2 thậm chí còn có một yếu tố mới cho sự biến động, đối với những người chơi chơi không nhất quán (cho phép xếp hạng của họ dao động nhiều hơn).
Giao thừa Freeman

1
Hấp dẫn. Tuy nhiên, tôi khẳng định rằng 'trung bình tốt hơn' không nhất thiết là 'tốt hơn'. Điều gì xảy ra nếu thời gian không chính xác hơn gây ra tác hại thực sự? Tuy nhiên, tôi sẽ đọc nó.
Tony Enni



7

Theo tôi hiểu, hệ thống xếp hạng Glicko thêm điểm đáng tin cậy vào số xếp hạng, điều này có thể mang lại sự công bằng cao hơn về các tính toán điều chỉnh điểm xếp hạng. Rõ ràng điều này có thể dẫn đến giả định sai lầm rằng có một mối tương quan giữa việc chơi các trò chơi được xếp hạng và kết quả là sức mạnh chơi (vì không chơi làm giảm điểm tin cậy, từ đó làm giảm giá trị số đánh giá của bạn bằng cách nào đó). Tôi thấy rất nhiều vấn đề liên quan đến điểm tin cậy, mặc dù tôi phải thừa nhận tôi không phải là chuyên gia về sự tinh tế của hệ thống. Chỉ cần chọn ba:

  • Một người chơi chỉ chơi trò chơi được xếp hạng hiếm có thể không nhận được lời mời nữa. Hãy tưởng tượng bạn là một giám đốc giải đấu mời những người chơi hấp dẫn. Bây giờ bạn phải chọn giữa 10 người chơi, tất cả đều có cùng số đánh giá, nhưng số độ tin cậy khác nhau. Có lẽ bạn sẽ chọn những người có số độ tin cậy tốt nhất đầu tiên. Theo thời gian, khoảng cách về độ tin cậy giữa những người chơi với nhiều game được đánh giá và những game ít hơn có thể mở rộng.
  • Thao tác số đánh giá có thể trở nên dễ dàng hơn. Ngay cả hệ thống ELO cũng không an toàn gian lận, bởi vì một số người đã đạt được xếp hạng hoặc chỉ tiêu IM / GM bằng cách chơi trong các giải đấu gian lận. Điểm số độ tin cậy tốt có thể giúp người chơi không có điểm đáng tin cậy rất rẻ - người chơi giỏi cho điểm xếp hạng mà không mất nhiều thời gian. Ngay khi có liên quan đến tiền, việc gian lận là một vấn đề quan trọng. Tôi có cảm giác hệ thống xếp hạng Glicko dễ bị thao túng hơn.
  • Việc giao tiếp và hiểu về sức mạnh chơi có thể trở nên khó khăn hơn với công chúng. Khi bạn truyền đạt một danh sách xếp hạng, bạn gặp vấn đề. Một người chơi có xếp hạng 2000-50 có "sức mạnh chơi thực sự" ở đâu đó trong khoảng thời gian từ 1900 đến 2100. Một người chơi khác đã có 1950-2000, nghĩa là một số trong phạm vi 1750 và 2150. Vì vậy, người chơi có 1950-2000 Thực tế có thể là người chơi tốt hơn, nhưng có lẽ sẽ được xếp hạng dưới người khác, chỉ vì anh ta chơi ít trò chơi hơn hoặc chống lại các đối thủ kém tin cậy hơn. Bạn làm cho việc giải thích hệ thống xếp hạng của bạn trở nên khó khăn hơn với mọi người, mà không thực sự đảm bảo sự công bằng hơn. Một GM ngừng chơi có thể đạt được "sức mạnh tiềm năng" và tự hào về tiềm năng vô địch thế giới của mình, bởi vì con số đáng tin cậy của anh ta làm tăng khả năng sai lệch (hãy nhớ rằng:

Tóm lại: Bạn có thể nhận được nhiều hơn bạn mặc cả, vì toàn bộ gói không chỉ đi kèm với các cải tiến. Và vì có những vấn đề tiền tệ nặng nề liên quan khi bạn nhìn vào phần trên của danh sách xếp hạng, tôi không thấy giá trị của việc thay đổi một hệ thống hiện có.


Hầu hết các danh sách xếp hạng đều có điểm cắt cho điểm tin cậy (RD), thay vì cố gắng sử dụng nó để xếp hạng người chơi. Vì vậy, năm 2000 (50) sẽ luôn được xếp hạng cao hơn năm 1950 (100). Theo đánh giá hiện tại của họ, họ được đánh giá cao hơn, bất kể độ tin cậy. Nếu người chơi 1950 (100) giành chiến thắng trước 2000 (50), thứ hạng của họ sẽ tăng đáng kể so với năm 1950 (50). Bạn có thể mô tả làm thế nào một người có thể gian lận hệ thống với Glicko chi tiết hơn? Bạn đang nói về việc đóng bao cát đánh giá của bạn nếu bạn có RD cao?
Giao thừa Freeman

@West Freeman: Tôi nghi ngờ đây là nơi hoàn hảo để chứng minh tính gian lận tương đối của hệ thống xếp hạng và tôi chỉ đang đoán, bởi vì đối với tôi, nó có vẻ rẻ hơn khi thao túng hệ thống, vì tôi sẽ không mất nhiều điểm đánh giá bản thân tôi khi tôi cố tình đánh mất một người chơi chưa được đánh giá. Điểm quan trọng hơn trong câu trả lời của tôi là bạn nên kiểm tra một hệ thống không chỉ để tính công bằng, mà còn để gian lận, tính dễ hiểu, v.v., trước khi bạn vứt bỏ một hệ thống làm việc.
Ray

Nhưng làm thế nào để nâng cao một cách giả tạo ai đó giúp họ? Thông thường, những người cố gắng chơi trò chơi hệ thống đang cố gắng hạ thấp xếp hạng của họ để họ có thể chơi ở các phần thấp hơn và giành giải nhất. Điều này có thể dễ dàng hơn với Glicko, nếu bạn tránh chơi trong một thời gian dài, và sau đó thua một vài trò chơi mà bạn nên thắng. Nhưng kết hợp với các tầng xếp hạng và thực tế là điều này chỉ có thể được thực hiện một lần trong một thời gian do RD mất thời gian để quay trở lại.
Eve Freeman

1
Bạn có thể cần xếp hạng cao để đạt được danh hiệu, nhận được lời mời hoặc được các câu lạc bộ trả tiền để chơi cho họ hoặc làm huấn luyện viên. Tôi đang nói về cờ vua chuyên nghiệp ở đây và tiền thật ở đâu, bởi vì bạn đã nghi ngờ hành vi của FIDE.
Ray
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.