Đã có nhiều nghiên cứu về lạm phát đánh giá?


24

Trận hòa của Magnus Carlsen trong vòng đấu London London Classic 2012 vào ngày hôm qua đã đảm bảo rằng xếp hạng của anh ấy trong danh sách xếp hạng FIDE được công bố tiếp theo sẽ vượt qua kỷ lục trước đó của Kasparov là 2851. Tôi đã thấy / nghe những người hâm mộ cờ đam mê tranh luận về thành tích xếp hạng tương đối của Carlsen so với Kasparov so với, nói, Fischer. Để rõ ràng, đó không phải là những gì tôi sau đây.

Một yếu tố quan trọng của các cuộc thảo luận như vậy là khái niệm về việc xếp hạng Elo nói chung đã trải qua lạm phát theo thời gian: có quá nhiều hơn 2700 đại kiện tướng ngày nay so với 20 năm trước vì sức mạnh chơi chung tăng lên hay chỉ vì một số xu hướng lạm phát tổng thể trong những con số? Tôi cũng không cố gắng thu hút những ý kiến ​​trần trụi về việc có hay không như vậy. Những gì tôi quan tâm muốn biết:

Những nỗ lực nghiên cứu nghiêm túc nào đã được thực hiện để trả lời câu hỏi thực nghiệm về việc liệu xếp hạng FIDE Elo có tự nhiên tăng cao theo thời gian vì một thứ gì đó ngoài sự gia tăng sức mạnh tổng thể trong nhóm người chơi không?

Mục nhập Wikipedia trên hệ thống xếp hạng Elo có một chút để nói về vấn đề này, và cũng chỉ ra một bài viết của Jeff Sonas của Chessmetrics . Ngoài bất kỳ con trỏ nào để làm việc bởi người khác, tôi, một người, cũng sẽ hoan nghênh một câu trả lời đưa ra một bản tóm tắt rõ ràng, súc tích về những điểm chính của Sonas.


Một điều khác cần suy nghĩ là lạm phát trong xếp hạng USCF. Đã có, và định kỳ USCF thực hiện các điều chỉnh nhiều cho sự kinh hoàng của người chơi. Vì USCF và FIDE sử dụng cùng một hệ thống, về cơ bản, tôi sẽ ngạc nhiên nếu lạm phát có thể ảnh hưởng đến USCF chứ không phải FIDE.
Tony Enni

2
Các hệ thống không giống nhau, ví dụ USCF có các mức xếp hạng rõ ràng là một yếu tố lạm phát.
RemcoGerlich

Câu trả lời:


19

Tôi ngạc nhiên khi bài báo "Xếp hạng cờ vua nội tại" của Ken Regan và Guy Haworth chưa được đăng. Đó chính xác là những gì được yêu cầu, nghiên cứu nghiêm túc về lạm phát xếp hạng. PDF

Về cơ bản, họ có các trò chơi từ ba giai đoạn (1976-1979, 1991-1994, 2006-2009), trong một số phạm vi xếp hạng (ví dụ: cả hai người chơi trong vòng 10 điểm 2200, trong vòng 10 điểm 2300, v.v.) và loại trừ các trò chơi có thể là bất thường, giống như các trận đấu đội. Đọc bài báo, có vẻ khá kỹ lưỡng.

Sau đó, họ so sánh các trò chơi một cách có hệ thống với Rybka 3.

Một số câu từ kết luận:

Chúng tôi kết luận rằng có một mối quan hệ suôn sẻ giữa xếp hạng Elo của người chơi thực tế và chất lượng nội tại của các lựa chọn di chuyển được đo bằng chương trình cờ và phù hợp với đại lý. Hơn nữa, các giá trị sfit cuối cùng thu được gần như giống nhau cho các mục tương ứng của cả ba khoảng thời gian.

Theo quan điểm của tôi, đó là bằng chứng khá chắc chắn chống lại sự tồn tại của lạm phát xếp hạng.


1
Cảm ơn đã đăng bài này, tôi cũng đã đến để chia sẻ điều này. Đây là dòng nghiên cứu duy nhất đã so sánh người chơi với một tiêu chuẩn khách quan. Tất cả các lập luận tôi đã thấy cho lạm phát xếp hạng là chủ quan và nói chung là giai thoại. Về lưu ý cá nhân, tôi không nghĩ rằng thực tế rằng Morphy có lẽ là 2300 đã lấy đi sự đánh giá cao của tôi về các trò chơi của anh ấy hoặc kỹ năng của anh ấy so với các đối thủ của anh ấy vào thời điểm đó.
Sam Copeland

12

Tôi chọc một số. Bạn có thể đã xem những trang này, nhưng dù sao tôi cũng sẽ đăng chúng:

a. Trang này sẽ làm bạn quan tâm . Nó bao gồm một bản sao của một lá thư từ chính Elo nêu rõ khả năng:

Do đó, theo thời gian, thang đánh giá có thể trôi đi trừ khi một số biện pháp được thực hiện để ổn định nó.

Ông cũng đề cập thêm rằng thang đánh giá không có mỏ neo, không có điểm cố định. So sánh với một vận động viên chạy một cuộc đua trong một giờ; một giờ bây giờ giống như một giờ 50 năm trước. Thời gian là một điểm cố định.

b. Ngoài ra, không phải câu hỏi 'lạm phát' đã được trả lời bởi những tiết lộ gần đây về xếp hạng cao đến từ các khu vực bị cô lập? Xem phần "Nhóm người chơi" của trang này để biết về vấn đề này. Hỗ trợ bổ sung , mặc dù nó không phải là học thuật và đặc biệt thông tin. Tìm kiếm "cô lập". Đây là một giai thoại khác cho thấy những gì xảy ra với các quần thể bị cô lập (và một ứng cử viên khác cho chủ đề 'tại sao người chơi cờ điên'!) Tôi không kiểm tra thực tế nhưng nó đủ dễ để làm.

c. Các Elo wiki bài viết nói về lạm phát như thể đó là một thực tế được chấp nhận.

d. Đây là một bài viết về lạm pháttheo dõi . Hãy nhìn vào khẩu súng hút thuốc năm 1986!


Tôi đã không nhìn thấy trang từ a., Cảm ơn vì điều đó. Về b., Tôi không biết bất cứ điều gì bạn đang đề cập đến; bạn có thể xây dựng?
ETD

2
Tôi cho rằng nếu không có mỏ neo thực sự thì không thể điều chỉnh chính xác; cuối cùng, chúng ta chỉ điều chỉnh một cách ngẫu nhiên theo một số giá trị tùy ý.
Daniel B

Có thể. Nhưng điều chỉnh xếp hạng để mang lại một đường cong phân phối tương tự có lẽ sẽ là một khởi đầu tốt. Ví dụ, một số năm trước, USCF điều chỉnh xếp hạng để người chơi trung bình của câu lạc bộ là 1500. Tôi không biết liệu họ có còn làm điều đó không.
Tony Enni

1
@TonyEnnis Chắc chắn, và tôi nghĩ rằng có lẽ nó sẽ tốt như bây giờ. Cụ thể, ý tôi là: điều gì xảy ra nếu "cầu thủ câu lạc bộ trung bình" ngày nay thực sự tốt hơn 50 năm trước? Không giống như chúng ta có thể khiến họ chơi với người chơi từ xưa ... Vì vậy, chúng ta còn lại với việc ước tính sức mạnh của người chơi bằng cách nào đó và điều chỉnh. Có lẽ với các chương trình máy tính (chạy trên một nền tảng tiêu chuẩn, được quy định), chúng ta có thể có một số loại neo không thiên vị, lâu dài. Nhưng ngay cả điều này cũng có vấn đề, chẳng hạn như việc phát hiện ra các chiến lược hoạt động tốt so với chương trình điểm chuẩn, v.v.
Daniel B

5

Nói một cách tuyệt đối, Carlsen 2012 chắc chắn là một người chơi mạnh hơn Kasparov 1985.

Nếu Carlsen 2012 du hành đúng lúc một trận đấu với Kasparov 1986, Carlsen sẽ đánh bại Kasparov. Điều này đơn giản là vì sự chuẩn bị được hỗ trợ bởi công nghệ hiệu quả hơn rất nhiều và Carlsen cũng có một lợi thế trong lý thuyết mở, bởi vì ông có kiến ​​thức tích lũy 1987-2012 mà Kasparov không có.

Tuy nhiên, Kasparov có lẽ là người chơi mạnh hơn Carlsen. Nếu chúng tôi lấy Danh sách Top 100 của FIDE cho tháng 6 năm 2000 (danh sách cũ nhất có thể đạt được), chúng tôi thấy rằng Kasparov với 2849 Elo cạnh tranh với trung bình 2641 cho 99 người theo dõi (khoảng cách Elo là 208 điểm) trong khi Calsen trong Fide Top 100 cho tháng 12 năm 2012 với 2848 Elo cạnh tranh với trung bình 2702 cho 99 người theo dõi của anh ấy (khoảng cách Elo là 146 điểm).

Elo là về sự khác biệt về điểm, không phải về giá trị tuyệt đối (100 điểm khác biệt đối với Elo có nghĩa là người chơi A tốt hơn người chơi B 2 lần, 200 điểm có nghĩa là tốt hơn 4 lần, v.v. Kasparov trung bình tốt hơn gấp 4 lần so với tất cả 99 người theo dõi của anh ấy, trong khi Carlsen có lẽ chỉ kém hơn 3 lần so với trung bình 99 người theo dõi của anh ấy.

Nếu chúng tôi đưa ra danh sách là Kasparov có khoảng cách tối đa với 99 người theo dõi của anh ấy và so sánh khoảng cách đó với Carlsen tốt nhất, chúng tôi sẽ có thể xác định cầu thủ nào thực sự là người giỏi nhất, bởi vì với 99 điểm dữ liệu, ngoại lệ (như một thiên tài khác) được giảm nhẹ nó.

Tuy nhiên, tôi tự hỏi nếu Carlsen hoặc Kasparov thực sự quan tâm đến ai là người tốt hơn.


3
Lập luận của bạn về Kasparov là một người chơi mạnh hơn Carlsen dựa trên việc so sánh từng người với 99 cầu thủ giỏi nhất tiếp theo. Chính xác, bạn lưu ý rằng xếp hạng Elo là tương đối, nhưng lập luận của bạn đưa ra một giả định thứ hai, không có căn cứ, cụ thể là 99 người chơi tiếp theo hôm nay có sức mạnh chơi trung bình tương đương với 99 người tiếp theo trong thời hoàng kim của Kasparov. Nếu giả định thứ hai đó không đúng, thì bạn đang so sánh Kasparov và Carlsen với các tiêu chuẩn khác nhau. Bạn cần tìm một nhóm người giống như ngày nay giống như thời của Kasparov. Bể bơi đó có lẽ là người mới bắt đầu trung bình của bạn, không phải siêu Grandmasters.
Thucydides411

4

Hệ thống của Elo có hai thành phần. Một cái là độc lập với lịch sử, cái kia thì không. Hệ thống của anh ta để tạo ra một "xếp hạng hiệu suất" trong suốt một sự kiện hoặc một khoảng thời gian không có thành phần lịch sử nào với nó; nó chỉ đơn giản là thước đo hiệu suất trong thời gian quy định. (Bộ nhớ làm tôi thất vọng về điểm này, nhưng tôi nghĩ khi anh ta tính toán xếp hạng cho FIDE thì đây là phương pháp anh ta đã sử dụng.)

Tuy nhiên, hệ thống Elo được sử dụng bởi các liên đoàn trên toàn cầu có một thành phần lịch sử, trong đó xếp hạng được tính bằng cách tính một delta, một thay đổi so với xếp hạng trước đó.

Hệ thống dựa trên lịch sử có xu hướng giảm phát tự nhiên. Hệ thống này là một hệ thống khép kín, không có điểm mới nào được tạo ra. Vì vậy, những người chơi mới đến, lấy điểm từ những người chơi đã thành lập và sau đó thoát ra (thông qua cái chết hoặc nghỉ hưu) trước khi trả lại tất cả những điểm đó cho đợt tăng tiếp theo của người chơi.

Nhiều ý tưởng đã được cố gắng để bù đắp cho điều này, một số làm việc tốt hơn những ý tưởng khác. Thêm vào đó là áp lực thương mại ở USCF đầu thập niên 70 để tăng xếp hạng nhanh hơn (quan điểm khá hoài nghi là người chơi sẽ mua một cuốn sách từ USCF và chơi trong một giải đấu, xếp hạng của họ sẽ tăng lên, khuyến khích họ mua một cuốn khác cuốn sách, v.v.) và lạm phát là một điều có thật ở một số điểm trong lịch sử.

Vì hệ thống của Elo dựa trên đường cong (chuông) bình thường, nên việc thử và đánh giá lạm phát bằng cách đo mức cực đoan là vô nghĩa; các thái cực có nhiều khả năng bị ảnh hưởng bởi tổng số người chơi được đánh giá hơn là thay đổi về sức mạnh thực tế hoặc bất kỳ loại lạm phát nào.


1

Tôi có một ý tưởng đơn giản. Hãy lấy một máy tính chơi cờ (phần cứng + phần mềm) có xếp hạng được đo từ 20 năm trước, thông qua chơi với các máy tính cờ khác có xếp hạng đã biết mà họ đã có 20 năm trước. Bây giờ, hãy đánh giá xếp hạng của nó ngay bây giờ (chính xác cùng một phần cứng cộng với chính xác cùng một phần mềm), thông qua chơi với các máy tính cờ vua hiện đại, với xếp hạng ngày nay đã biết. Sự khác biệt của hai phép đo sẽ tạo thành lạm phát xếp hạng trong 20 năm qua. Đủ đơn giản?


Nó ít nhiều sẽ tính toán lạm phát xếp hạng cho máy tính , không phải cho người chơi. Con người chơi khác với máy tính hơn là chính mình.
Glorfindel

1

Các kết luận của bài báo Regan-Haworth nên được đưa ra bằng một hạt muối, vì nó dường như mâu thuẫn với các phân tích trò chơi máy tính khác , trên phần mềm và phần cứng tốt hơn và với các phương pháp toán học tiên tiến hơn. Ở đó, họ kết luận (xem Bảng 9), ví dụ, Karpov năm 1977 chơi ở mức thấp hơn một chút so với Kasparov năm 2001 và Anand năm 2008 (dự kiến ​​đạt khoảng 47% số điểm), và thực sự tốt hơn Topalov năm 2005 và Ponomariov trong Năm 2011. Vì Kasparov-2001 được đánh giá cao hơn 150 điểm so với Karpov-1977, nên đánh giá này sẽ giúp anh ta đạt 70% số điểm. Tôi không thấy làm thế nào để hòa giải điều này với tuyên bố rằng không có lạm phát xếp hạng.

Cũng lưu ý rằng, trái với yêu cầu ngầm trong câu hỏi, không có cơ chế nào đánh giá sẽ phản ánh sự thay đổi về sức mạnh tổng thể trong nhóm người chơi . Về mặt thực nghiệm, trường hợp sức mạnh điển hình của người chơi 2600 không thay đổi trong khoảng thời gian nhất định, nhưng đây chỉ là sự trùng hợp thay vì phản ánh các thuộc tính cơ bản của hệ thống ELO và chắc chắn không thể khái quát.

Nếu chúng ta định nghĩa lạm phát một cách ngây thơ và chỉ đo mức xếp hạng trung bình của 100 người chơi hàng đầu, thì, như có thể thấy từ liên kết này , đã có lạm phát ổn định cho đến năm 2012 và không có lạm phát kể từ đó - xếp hạng trung bình top 100 dao động 2700 và 2705 trong 7 năm qua .


0

Đầu tiên, bạn phải xác định những gì bạn có ý nghĩa tốt nhất. Ví dụ, tốt nhất có nghĩa là bạn là người chơi thống trị nhất trong thời đại của bạn? Hoặc nó có nghĩa là chất lượng trình phát của bạn vượt trội so với tất cả những người chơi khác. Và nếu chất lượng là những gì bạn muốn nói thì bạn định nghĩa chất lượng như thế nào?

Paul Morphy có lẽ là cầu thủ thống trị nhất. Ví dụ, khi anh ấy 12 tuổi, anh ấy đã đánh bại một cầu thủ hàng đầu (Lowenthal) trong trận đấu 3-0. Theo Edo và cờ vua, anh ta có lẽ đã là một trong những người chơi giỏi nhất thế giới ở tuổi 12! Ở tuổi 21, anh thi đấu đồng thời với 5 cầu thủ hàng đầu (Bird, Barnes, Boden, De Reviere và Lowenthal) và ghi bàn 3-2.

Tuy nhiên, hầu hết sẽ cho rằng sự thống trị là một chỉ số kém về người giỏi nhất. Rốt cuộc, Morphy đã được mô tả là người chơi cờ hiện đại đầu tiên. Sự cạnh tranh của anh ấy rất yếu so với các nhà vô địch sau đó.

Một định nghĩa khác đã được sử dụng là chất lượng chơi. Tuy nhiên, định nghĩa này cũng có rất nhiều vấn đề. Vào những năm 1900, một số cá nhân đã lập luận rằng Steinitz hoặc Lasker là những người chơi giỏi nhất mọi thời đại cho rằng kiến ​​thức về lý thuyết mở và hiện đại của họ sẽ khiến họ vượt trội hơn người chơi từ xưa. Tuy nhiên, Louis Paulsen đã đưa ra một số lập luận rất thông minh chống lại giả thuyết này. Ông lập luận rằng Morphy (người có trí nhớ nhiếp ảnh và ghi nhớ mã vạch Louisana vào năm 19 tuổi) nếu được sống lại sẽ học được cách mở và lý thuyết hiện đại trong vòng một năm và có thể cạnh tranh thành công với những người chơi cờ hiện đại.

Regan lập luận rằng những người chơi cờ hiện đại có quyền truy cập vào máy tính cờ vua và phương pháp đào tạo hiện đại chơi giống như máy tính hơn là người chơi trong quá khứ. Điều đó không có gì đáng ngạc nhiên vì chúng được đào tạo bởi máy tính nhưng điều đó có nghĩa là những người chơi hiện đại thực sự tốt hơn? Điều này đặt ra câu hỏi Fischer hoặc CapTHER sẽ làm gì nếu họ có quyền truy cập vào các máy tính hiện đại?

Ngoài ra, máy tính phân tích của giáo sư Regan gây ấn tượng với tôi là chưa hoàn thiện vì nó chỉ liên quan đến một vài giai đoạn năm năm và những người chơi trong phân tích không được đề cập. Một phân tích máy tính kỹ lưỡng hơn của các giáo sư Matej Guid và Ivan Bratko đã phát hiện ra rằng trên thực tế, CapTHER chơi giống như một máy tính hơn là những người chơi hiện đại! https://en.chessbase.com/post/computers-choose-who-was-the-strongest-player-. Tuy nhiên, Guid và Bratko lưu ý rằng có một vấn đề với kết luận từ điều này rằng CapTHER là một người chơi tốt hơn. Có lẽ phong cách khá trầm lắng của anh ấy đã dẫn đến ít vị trí hơn, nơi anh ấy sẽ có khả năng sai lầm. Do đó, tỷ lệ sai lầm của anh ta thấp hơn nhưng anh ta cũng gây áp lực ít hơn cho đối thủ so với những người chơi hung hăng hơn. Trên thực tế, CapTHER có tỷ lệ hòa cao so với những người cùng thời.

Ngược lại, một người chơi có chiến thuật cao như Kasparov có thể bị phạt bởi phong cách chơi của anh ta, điều này có nhiều khả năng dẫn đến các vị trí chiến thuật cao, nơi máy tính đặc biệt là một lỗi tìm kiếm tốt. Trên thực tế, máy tính có xu hướng hoạt động tốt hơn so với người chơi chiến thuật so với người chơi ở vị trí đóng hoặc đặc biệt là vị trí đóng trong đó chiến thuật đóng vai trò bên cho thuê. Do đó, phân tích máy tính dựa trên số lượng lỗi máy tính được phát hiện có khả năng ủng hộ người chơi vị trí đóng kín. Ngược lại, một người chơi năng nổ như Kasparov có thể mắc nhiều lỗi chiến thuật hơn một số người chơi khác vì anh ta tìm kiếm những vị trí rất phức tạp nhưng đối thủ của anh ta sẽ còn làm được nhiều hơn thế!

Do đó, bạn cần một hệ thống trọng số lỗi không chỉ tính tỷ lệ phần trăm lỗi trên 100 lần di chuyển (về cơ bản là những gì Regan và Guid và Bratko đã làm). Thay vào đó, bạn cần tính toán sự khác biệt giữa tỷ lệ lỗi và tỷ lệ lỗi của đối thủ. Rốt cuộc, cờ vua là về việc phạm ít lỗi hơn đối thủ của bạn. Tạo áp lực lên đối thủ của bạn để gây ra nhiều lỗi hơn được coi là chất lượng tốt.

Tuy nhiên, phương pháp tính toán sửa đổi của tôi dẫn đến một vấn đề khác là các phân tích máy tính này không xem xét đến sức mạnh của đối thủ của bạn. Ví dụ, có lẽ Larson đạt được xếp hạng cờ vua rất cao vì phong cách hung hăng (lạc quan) của anh ta dẫn đến sự thống trị so với những người chơi được đánh giá thấp hơn. Tuy nhiên, anh gặp rắc rối trong các trò chơi chống lại những người chơi có đánh giá ngang nhau. Những người chơi khác thường xuyên tranh luận rằng anh ta quá lạc quan trong lối chơi của mình trước những người chơi được đánh giá cao khác. Để tránh vấn đề này, phân tích kiểm tra lỗi máy tính chỉ nên xem các trò chơi với các đối thủ mạnh (ví dụ: 10, 20 hoặc 100 người chơi hàng đầu). Tuy nhiên, điều đó vẫn không giải quyết được vấn đề tăng cạnh tranh mạnh mẽ theo thời gian.

Có thể khắc phục vấn đề tăng chất lượng chơi bằng cách xem lại các xếp hạng như Chessmetrics không? Trên thực tế, tôi thích hệ thống xếp hạng trở lại của Edo http://www.edochess.ca/bởi vì các giả định thống kê là tốt hơn. Ví dụ: Chessmetrics giả định xếp hạng cao nhất của người chơi xảy ra khi họ 40 tuổi. Tôi nghi ngờ điều đó đúng với tất cả mọi người và nhiều người chơi đã từ bỏ cờ vua trước tuổi đó hoặc cách chơi của họ chỉ là đỉnh cao trong một vài năm (ví dụ: Harry Nelson Pillsbury, Charousek, Fischer, Morphy, Rubinstein, Fine). Thật không may, Edo chỉ so sánh xếp hạng người chơi từ năm 1811 đến 1920. Theo Edo, CapTHER và Morphy được đánh giá là hai người chơi cao nhất từ ​​thời đại này. Theo Chessmetrics, CapTHER và Lasker là hai người chơi giỏi nhất (Morphy thậm chí không lọt vào top ten.) Theo Chessmetrics, Zukertort, Steinitz, Tarrasch, Lasker, Pillsbury, Maroczy, Marshall, Janowsky, Chigorin, Schelecter, Black Duras, Teichmann, Neumann, Vidmar, Gunsberg, Rubinstein và Burn tốt hơn Morphy.

Nếu sự đổi mới dẫn đến sự thống trị trong một kỷ nguyên cờ cụ thể theo thời gian và ngày càng khó đổi mới theo thời gian vì sức mạnh của cuộc thi tăng lên, bạn không thể đo được sự thống trị thực sự bằng cách chỉ nhìn vào hồ sơ trận đấu của 30 người chơi hàng đầu. Đó là, việc Magnus Carlsen thống trị các đối thủ của mình khó hơn rất nhiều so với các nhà vô địch trong quá khứ. Nếu bạn nhìn lại xếp hạng trở lại, thật dễ dàng để thấy rằng mức độ khác biệt giữa xếp hạng của những người chơi hàng đầu đã giảm dần theo thời gian. Vì vậy, tôi tin rằng một mô hình thống kê kiểu Edo có tính đến khó khăn để thống trị theo thời gian sẽ là một cách tiếp cận tốt hơn so với những gì đã được thử trước đây. Ví dụ, Fischer là một người chơi khá nổi trội trong thời đại của anh ta vì anh ta đã thắng 20 trận liên tiếp. Kasparov hay Karpov là chuỗi chiến thắng dài nhất so với chuỗi chiến thắng này là gì? Theo Sei Girls, chuỗi chiến thắng dài nhất của họ là bảy trận.

Tất nhiên, tôi không khẳng định rằng các chiến thắng là một số liệu tốt. Tôi chỉ lập luận rằng sự thống trị của xếp hạng hoặc trong các trận đấu cá nhân với các cầu thủ hàng đầu khác là một số liệu hữu ích không được xem xét rõ ràng trong các hệ thống xếp hạng trở lại hiện tại.

Vì vậy, phân tích giấc mơ của tôi là bạn sử dụng xếp hạng Edo dựa trên cơ sở dữ liệu chỉ bao gồm 20 hoặc 30 người chơi hàng đầu từ mỗi giai đoạn năm năm. Sau khi bạn hoàn thành phân tích này, bạn xem xét lại kết quả của mình bằng một yếu tố thống trị. Đó là, những người chơi gần đây có được một yếu tố tiền thưởng được tính bằng cách ước tính quỹ đạo của sự khó khăn khi thống trị theo thời gian (sự chênh lệch về xếp hạng giữa 30 người chơi hàng đầu theo thời gian). Tiếp theo, bạn sẽ xác nhận phân tích này bằng cách so sánh tỷ lệ phần trăm người chơi của máy tính cờ vua được tính toán sai lầm mà đối thủ của họ thực hiện trừ đi sai lầm ngớ ngẩn của chính họ. Nếu điều này làm mất hiệu lực ở trên, thì bạn cần phải xem lại theo phân tích kiểm tra lỗi máy tính nếu nó cho thấy có xu hướng những người chơi hàng đầu gần đây chơi chính xác hơn ngay cả khi đã xem xét đến yếu tố thống trị của tôi.

Tôi đoán dựa trên nhãn cầu của tôi, là Kasparov sẽ làm rất tốt. Nhưng đó chỉ là dự đoán.


2
Điều này không xuất hiện để trả lời câu hỏi.
Herb Wolfe

Quan điểm của tôi là bạn không thể trả lời câu hỏi về lạm phát xếp hạng cho đến khi bạn xác định khả năng chơi cờ. Tôi đã xem xét nghiên cứu cố gắng điều chỉnh lạm phát xếp hạng hoặc cố gắng xác định mức độ khác nhau của các nhà vô địch cờ vua thay đổi theo thời gian (đó là những gì lạm phát xếp hạng là tất cả về). Tôi tin rằng vấn đề là các nhà nghiên cứu chưa thực sự xác định các giả định của họ về những gì họ tin rằng khả năng cờ vua là. Theo tôi, không xác định khả năng chơi cờ, bạn không thể trả lời câu hỏi liệu khả năng cờ có thay đổi theo thời gian hay nói bất cứ điều gì về lạm phát xếp hạng.
Trẻ mới biết đi
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.