Nguyên tắc chung để mở rộng hệ thống Elo cho các trò chơi trong đó lề của chiến thắng là vấn đề


7

Ghi chú

Tôi là người dùng lần đầu của trang web này và không chắc điều gì quyết định mức độ rộng của một câu hỏi. Tôi có ý thức giới hạn câu hỏi theo các nguyên tắc chung để tránh làm cho nó quá rộng (bằng cách hỏi ví dụ, v.v.).

Tuy nhiên, nếu nó quá rộng, cho tôi biết trong các ý kiến, và tôi đề nghị làm thế nào để thu hẹp nó xuống.

Câu hỏi

Tôi biết (thông qua cờ vua) của hệ thống xếp hạng Elo và cách thức hoạt động của nó. Về cơ bản nếu bạn biết xếp hạng của hai người chơi, bạn có thể tính điểm dự kiến của cả hai người và điều chỉnh xếp hạng của họ dựa trên điểm thực tế.

Tuy nhiên, tôi đã tự hỏi làm thế nào hệ thống này được điều chỉnh để hoạt động cho các trò chơi trong đó lề của chiến thắng là vấn đề.

Cụ thể, tôi đã tự hỏi làm thế nào hệ thống xếp hạng có thể được mở rộng để người ta có thể tính toán không chỉ điểm số dự kiến mà còn cả biên dự kiến ​​của chiến thắng hoặc thất bại từ xếp hạng của hai người chơi / đội.

Tôi cũng mong hệ thống sẽ xem xét điểm số thực tế cũng như tỷ lệ chiến thắng thực tế khi điều chỉnh xếp hạng sau một trận đấu.

Một ví dụ giả thuyết

Các chi tiết thực tế không cần phải giống như những gì tôi đề cập ở đây, nhưng ý tưởng chung diễn ra như sau:

Hãy xem xét một hệ thống xếp hạng trong đó Chelsea và Man City có xếp hạng 2000 và 2100. Tôi đang tìm kiếm một hệ thống xếp hạng không chỉ dự đoán tỷ số (khoảng 0,64 cho Thành phố) mà còn là biên của chiến thắng.

Xem xét rằng xếp hạng bằng cách nào đó mang lại cho chúng tôi tỷ lệ dự kiến ​​là +3,2 cho Manchester City và đội thắng 2-0, tôi cũng hy vọng hệ thống sẽ giảm xếp hạng của Thành phố vì không giành được tỷ lệ đủ lớn.

Nhưng tôi tự hỏi liệu hai biến số ( điểm dự kiến ​​và tỷ lệ dự kiến ​​của chiến thắng ) là cần thiết hay chỉ một ( điểm số dự kiến ) thực hiện công việc.

Nói ngắn gọn

Các nguyên tắc và phương pháp chung liên quan đến việc mở rộng hệ thống xếp hạng Elo cho các trò chơi trong đó lề của chiến thắng là gì?

Câu trả lời:


6

Một phiên bản đơn giản của ELO có thể được sử dụng như một hồi quy logistic: cho người chơi i,j với xếp hạng Ri,Rj,

P(i beats j)=11+exp(β(RiRj)).

Vì vậy, bạn có thể dễ dàng dự đoán điểm số bằng cách sử dụng một hàm liên kết khác, ví dụ như một lorentzian hoặc gaussian:

P(Game score=x)=aexp(α|β(RiRj)x|γ)
,

điểm số trò chơi có thể tích cực (ủng hộ i) hoặc tiêu cực (có lợi cho j). Vì vậy, bạn không cần phải tính toán xác suất đánh bại và chỉ cần tối ưu hóa trực tiếp điểm số trò chơi.


Điều đó nghe có vẻ hứa hẹn. Tôi đã nghĩ về một cái gì đó tương tự, nơi biên độ chiến thắng dự kiếnme được đưa ra bởi me=A(2Se1)Se là số điểm dự kiến, được tính như bình thường (Se= =11+10-dR400). Sau đó,ΔR= =K(mmột-me), Ở đâu mmộtlà lề thực tế của chiến thắng. Các hằng sốMộtKTôi có thể, tôi đoán, có được bằng một số thử nghiệm.
Harry Weasley

Bạn có thể chỉnh sửa câu trả lời của mình để giải thích một chút về cách xếp hạng được cập nhật sau khi biết kết quả của trò chơi không? Tôi không chắc chắn nếu tôi hiểu đầy đủ.
Harry Weasley

@HarryWeasley: Cách đơn giản nhất để cập nhật kết quả cho người chơi (Tôi,j) với một datapoint mới là để tính toán lại RTôi,Rjbằng cách cập nhật chức năng mất, thông qua độ dốc giảm dần.
Alex R.

Xin lỗi vì quá phiền phức, nhưng tôi không phải là chuyên gia và tôi không hiểu một số thuật ngữ (đặc biệt là 'chức năng mất' và 'giảm độ dốc') mà bạn đã sử dụng trong nhận xét cuối cùng của mình. Bạn có thể viết lại tương tự trong các điều khoản đơn giản hơn? :)
Harry Weasley

@AlexR. hàm đại diện bởi β là gì?
dùng160104

3

Có một số công trình có ý định bao gồm các lề của chiến thắng trong hệ thống đánh giá (ví dụ FiveThirtyEight cho NFL), nhưng thường xếp hạng hệ thống (ví dụ Elo , Glicko , hoặc chúng tôi rankade - đây là một sự so sánh ) không kết hợp các lề của chiến thắng.

Trong hầu hết các môn thể thao / trò chơi, tỷ lệ chiến thắng là không đáng kể . Trong cờ vua, mục tiêu là để đánh bại vua của đối thủ của bạn (và không quan trọng bạn và đối thủ của bạn có bao nhiêu quân cờ khi bạn có thể làm điều này), trong bóng rổ - như trong hầu hết các môn thể thao - chiến thắng 89-60 , hoặc 86-85 hoặc 90-23 cho đội chỉ một chiến thắng (và điểm số không quan trọng - ngoại trừ sợi giây hầu hết không sử dụng), và vân vân.

Hãy xem xét một hệ thống xếp hạng trong đó Chelsea và Man City có xếp hạng 2000 và 2100. Tôi đang tìm kiếm một hệ thống xếp hạng không chỉ dự đoán tỷ số (khoảng 0,64 cho Thành phố) mà còn là biên của chiến thắng. Xem xét rằng xếp hạng bằng cách nào đó mang lại cho chúng tôi tỷ lệ dự kiến ​​là +3,2 cho Manchester City và đội thắng 2-0, tôi cũng hy vọng hệ thống sẽ giảm xếp hạng của Thành phố vì không giành được tỷ lệ đủ lớn.

Đối diện với môn bóng bầu dục, trong đó bạn nhận được một phần thưởng (ít) nếu bạn ghi được hơn 4 lần thử, trong bóng đá Thành phố có được 3 điểm ngay cả khi thắng 8-0 (và có lẽ, trong khi dẫn 4-0, HLV của City muốn các cầu thủ tốt nhất của họ nghỉ ngơi cho các trận đấu tiếp theo ...). Biên độ chiến thắng có thể là đáng kể (cho thấy có sự khác biệt lớn giữa các đội), nhưng cũng không thể , vì nhiều lý do. Và, trong một cấu trúc mà mục tiêu đang giành chiến thắng (không phân biệt điểm số), việc xây dựng một hệ thống xếp hạng thưởng cho một chiến thắng lớn 'không đáng tin cậy' (3 điểm cho xếp hạng vô địch) không phải là một ý tưởng hay Chiến thắng -0 với đội cuối cùng trong bảng xếp hạng (cùng 3 điểm!).

Cuối cùng, bằng cách nào đó bạn có thể thưởng cho một chiến thắng lớn hơn dự kiến , nhưng bạn không thể 'trừng phạt' một đội vì đã không giành chiến thắng với một tỷ lệ đủ lớn . Họ đã thắng, vì vậy họ đã làm công việc của họ.

Chắc chắn có (một vài) trò chơi trong đó lề của chiến thắng là vấn đề , nhưng bóng đá (và gần như tất cả các môn thể thao, cả hai đều có vòng tròn hoặc dấu ngoặc) không có trong danh sách này.


Cảm ơn câu trả lời của bạn (+1)! Tôi thấy nó khá nhiều thông tin và thích ý tưởng về thuật toán ree. Mặc dù tôi đồng ý rằng biên độ không đáng kể trong nhiều trò chơi, câu hỏi của tôi là về những trò chơi thực sự quan trọng.
Harry Weasley

Không có gì! Khi xếp hạng, bạn có thể dễ dàng quản lý vấn đề này (nghĩa là kết hợp tỷ lệ thắng) bằng tính năng trọng lượng (ví dụ: trọng lượng bình thường cho các trận đấu có tỷ lệ bình thường, trọng lượng nhẹ cho tỷ lệ thấp, trọng lượng nặng cho tỷ lệ lợi nhuận cao), điều chỉnh điểm thưởng (đó sẽ là luôn luôn được trao cho người chiến thắng
Tomaso Neri
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.