Mô hình hóa một kết quả thắng-thua trong thể thao


7

Tôi có dữ liệu về các đội, cầu thủ khác nhau, v.v. Tôi đang cố gắng tìm ra cách tốt nhất để mô hình hóa kết quả của trận đấu, có thể kết thúc bằng một chiến thắng cho đội chủ nhà, thua cho đội chủ nhà hoặc hòa. Tôi đang gặp khó khăn khi mô hình hóa này mặc dù.

Ví dụ: tôi có thể sử dụng hồi quy poisson để mô hình hóa số mục tiêu mà mỗi đội ghi được, sau đó tính toán xác suất của họ, nhưng tôi không quá hài lòng với giả định độc lập. Tôi cũng có thể làm một poisson bivariate, mà tôi không có nhiều kinh nghiệm. Tôi đang tự hỏi một cách tiếp cận phù hợp là gì để mô hình hóa sự phụ thuộc vào kết quả của hai đội, trong khi vẫn bảo đảm thực tế là các kết quả là loại trừ lẫn nhau (xác suất được chỉ định để thắng thua sẽ hòa hợp với nhau).


Tại sao không thử mô hình hóa sự khác biệt mục tiêu dự kiến ​​thay vì mô hình hóa mục tiêu được ghi giữa hai đội một cách độc lập?
Antoine Vernet

Tôi không có câu trả lời, nhưng tôi đã theo dõi trang web này làm điều tương tự như những gì bạn dự định, họ đã đưa ra dự đoán cho Euro 2016, sau đó so sánh với tỷ lệ ngẫu nhiên và tỷ lệ cược từ trang web đặt cược. Hóa ra tỷ lệ cược thực tế tốt hơn một chút so với dự đoán của họ: kickoff.ai
Metariat

Câu trả lời:


4

Bạn có thể sử dụng phân phối Poisson bivariate với hàm khối lượng xác suất

f(x,y)=exp{(λ1+λ2+λ3)}λ1xx!λ2yy!k=0min(x,y)(xk)(yk)k!(λ3λ1λ2)k

trong đó và và , do đó bạn có thể coi là thước đo sự phụ thuộc giữa hai bên Phân phối Poisson. Thế hệ pmf và ngẫu nhiên cho phân phối này được triển khai trong gói ExtraDistr nếu bạn đang sử dụng R.E(X)=λ1+λ3E(Y)=λ2+λ3cov(X,Y)=λ3λ3

Trên thực tế, phân phối này được mô tả dưới dạng phân tích dữ liệu thể thao của Karlis và Ntzoufras (2003), vì vậy bạn có thể kiểm tra giấy của họ để biết thêm chi tiết. Các tác giả trong bài báo trước đó cũng thảo luận về mô hình Poisson đơn biến, trong đó họ kết luận rằng giả định độc lập cung cấp xấp xỉ hợp lý vì sự khác biệt giữa điểm số của cả hai đội không phụ thuộc vào tham số tương quan của bivariate Poisson (Karlis và Ntzoufras, 2000).

Kawamura (1984) đã mô tả các tham số ước tính cho phân phối Poisson bivariate bằng cách tìm kiếm trực tiếp bằng khả năng tối đa. Về mô hình hồi quy, bạn có thể sử dụng thuật toán EM để ước tính khả năng tối đa, như Karlis và Ntzoufras (2003) hoặc mô hình Bayesian ước tính bằng MCMC. Thuật toán EM cho hồi quy Poisson bivariate được triển khai trong gói bivpois (Karlis và Ntzoufras, 2005) không may ra khỏi CRAN tại thời điểm này.


Karlis, D., & Ntzoufras, I. (2003). Phân tích dữ liệu thể thao bằng cách sử dụng các mô hình Poisson bivariate. Tạp chí của Hiệp hội Thống kê Hoàng gia: Sê-ri D (Nhà thống kê), 52 (3), 381-393.

Karlis, D. và Ntzoufras, I. (2000) Về mô hình hóa dữ liệu bóng đá. Học sinh, 3, 229-244.

Kawamura, K. (1984). Tính toán trực tiếp công cụ ước tính khả năng tối đa cho phân phối Poisson bivariate. Tạp chí toán học Kodai, 7 (2), 211-221.

Karlis, D. và Ntzoufras, I. (2005). Bivariate Poisson và các mô hình hồi quy Poisson bivariate chéo chéo trong R. Tạp chí Phần mềm Thống kê, 14 (10), 1-36.


3

Poisson bivariate không chứa tương quan âm giữa và . Một mô hình cho điều này có thể được xây dựng bằng cách áp dụng hàm lượng tử Poisson cho từng thành phần của copula Gaussian. Hàm khối lượng xác suất bivariate kết quả dễ dàng được tính trong R với mã sau trong đó vectơ chứa các tham số của hai phân phối Poisson biên và là mối tương quan của phân phối nhị phân chuẩn.x1x2lambdarho

library(mvtnorm)
dbipoisgausscopula <- function(x, lambda, rho) {
   pmvnorm(lower=qnorm(ppois(x-1,lambda)),
      upper=qnorm(ppois(x,lambda)),
      mean=c(0,0),
      sigma=matrix(c(1,rho,rho,1),2,2)
   )
}
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.