Các thuật toán học máy có thể dự đoán điểm số thể thao hoặc chơi?


40

Tôi có nhiều bộ dữ liệu NFL mà tôi nghĩ có thể tạo ra một dự án phụ tốt, nhưng tôi chưa làm gì với chúng cả.

Đến với trang web này khiến tôi nghĩ đến các thuật toán học máy và tôi tự hỏi chúng có thể dự đoán kết quả của các trận bóng đá hay thậm chí là lần chơi tiếp theo tốt đến mức nào.

Dường như với tôi rằng sẽ có một số xu hướng có thể được xác định - vào ngày 3 và 1, một đội có sức mạnh chạy ngược về mặt lý thuyết nên có xu hướng chạy bóng trong tình huống đó.

Ghi điểm có thể khó dự đoán hơn, nhưng đội chiến thắng có thể.

Câu hỏi của tôi là liệu đây có phải là những câu hỏi hay để ném vào một thuật toán học máy. Có thể là một ngàn người đã thử nó trước đây, nhưng bản chất của thể thao làm cho nó trở thành một chủ đề không đáng tin cậy.

Câu trả lời:


18

Có rất nhiều câu hỏi hay về Bóng đá (và thể thao, nói chung) sẽ rất tuyệt vời khi ném vào một thuật toán và xem những gì xuất hiện. Phần khó khăn là biết những gì để ném vào thuật toán.

Một đội có RB tốt chỉ có thể vượt qua thứ 3 và ngắn chỉ vì các đối thủ có thể sẽ chạy, chẳng hạn. Vì vậy, để thực sự tạo ra một số kết quả xứng đáng, tôi đã phá vỡ vấn đề thành từng phần nhỏ hơn và phân tích chúng theo thống kê trong khi ném chúng vào máy.

Có một vài trang web (tốt) cố gắng làm như vậy, bạn nên kiểm tra và sử dụng bất cứ thứ gì họ tìm thấy để giúp bạn:

Và nếu bạn thực sự muốn khám phá Phân tích dữ liệu thể thao, bạn chắc chắn nên kiểm tra các video của Hội nghị thể thao Sloan . Có rất nhiều trong số họ lan truyền trên Youtube.


13

Vâng. Tại sao không?! Với rất nhiều dữ liệu được ghi lại trong mỗi môn thể thao trong mỗi trò chơi, việc sử dụng dữ liệu thông minh có thể khiến chúng ta có được những hiểu biết quan trọng về hiệu suất của người chơi.

Vài ví dụ:

Vì vậy, vâng, phân tích thống kê về hồ sơ người chơi có thể cung cấp cho chúng tôi thông tin chi tiết về người chơi nào có khả năng thực hiện nhiều hơn nhưng không phải người chơi nào sẽ thực hiện . Vì vậy, học máy, một người anh em họ thân thiết của phân tích thống kê sẽ được chứng minh là một người thay đổi trò chơi.


9

Chắc chắn họ có thể. Tôi có thể nhắm mục tiêu bạn đến một bài báo tốt đẹp . Khi tôi đã sử dụng nó để thực hiện thuật toán dự đoán kết quả giải đấu bóng đá, chủ yếu nhằm mục đích có một số giá trị chống lại các nhà cái.

Từ bản tóm tắt của giấy:

một mô hình tổng quát năng động Bayes để ước tính các kỹ năng phụ thuộc thời gian của tất cả các đội trong một giải đấu và để dự đoán các trận bóng đá vào cuối tuần tới.

Từ khóa:

Mô hình động, Mô hình tuyến tính tổng quát, Mô hình đồ họa, Phương pháp Markov Chain Mark Carlo, Dự đoán các trận đấu bóng đá

Trích dẫn:

Rue, Havard và Oyvind Salvesen. "Dự đoán và phân tích hồi cứu các trận bóng đá trong một giải đấu." Tạp chí của Hiệp hội Thống kê Hoàng gia: Dòng D (Nhà thống kê) 49.3 (2000): 399-418.


7

Máy học và kỹ thuật thống kê có thể cải thiện dự báo, nhưng không ai có thể dự đoán kết quả thực sự.

Có một cuộc thi kaggle vài tháng trước về dự đoán Giải đấu NCAA 2014 . Bạn có thể đọc Diễn đàn cạnh tranh để hiểu rõ hơn về những gì mọi người đã làm và kết quả họ đạt được.


7

Nó đã được chỉ ra trước đó rằng các kỹ thuật học máy có thể được áp dụng để dự đoán kết quả thể thao. Tìm kiếm google đơn giản sẽ cung cấp cho bạn một loạt các kết quả.

Tuy nhiên, người ta cũng đã chứng minh (đối với NFL btw) rằng các mô hình dự đoán rất phức tạp, mô hình dự đoán đơn giản, người đặt câu hỏi hoặc kiến ​​thức đám đông bằng cách sử dụng thông tin cá cược, tất cả đều thực hiện ít nhiều giống nhau. Nguồn: " Mọi thứ đều rõ ràng một khi bạn biết câu trả lời - Lỗi thông thường như thế nào ", Chương 7, của Duncan Watts.


Hấp dẫn. Lý do tôi đặt câu hỏi là tôi tự hỏi liệu có thứ gì đó tương tự như "ngụy biện của người đánh bạc" (hay thậm chí là chính gf). Tôi nghĩ rằng có thể có một cơ hội đã được chứng minh là một liên doanh không có kết quả. Tuy nhiên - những câu trả lời khác là hấp dẫn.
Steve Kallestad

6

Michael Maouboussin, trong cuốn sách "Phương trình thành công", xem xét sự may mắn khác biệt với kỹ năng trong các nỗ lực khác nhau, bao gồm cả thể thao. Anh ta thực sự xếp hạng thể thao bằng số lượng may mắn góp phần vào thành tích trong các môn thể thao khác nhau (trang 23) và khoảng 2/3 hiệu suất trong bóng đá là do kỹ năng. Ngược lại, tôi đã sử dụng kỹ thuật của MM để phân tích hiệu suất trong cuộc đua Công thức 1 và thấy rằng 60% là do kỹ năng (ít hơn tôi mong đợi.)

Điều đó nói rằng, có vẻ như loại phân tích này sẽ ngụ ý rằng một bộ tính năng đủ chi tiết và được chế tạo sẽ cho phép các thuật toán ML dự đoán hiệu suất của các đội NFL, thậm chí có thể ở cấp độ chơi, với sự cảnh báo rằng phương sai đáng kể sẽ vẫn tồn tại do ảnh hưởng may mắn trong trò chơi.



5

Tôi đã thực hiện một số nghiên cứu trong lĩnh vực này. Tôi đã tìm thấy chuỗi Markov đầu tiên hoạt động tốt để dự đoán tính năng động trong việc ghi điểm trong nhiều môn thể thao.

Bạn có thể đọc chi tiết hơn tại đây: http://www.epjdatascience.com/content/3/1/4


5

Họ không thể dự đoán, nhưng họ có thể cho bạn biết kết quả rất có thể. Có một nghiên cứu về cách tiếp cận này từ Etienne - Dự đoán ai sẽ vô địch World Cup với Ngôn ngữ Wolfram . Đây là một nghiên cứu rất chi tiết, vì vậy bạn có thể kiểm tra tất cả các phương pháp được sử dụng để có được các dự đoán.

Thật thú vị, 11 trong số 15 trận đấu đã chính xác!

Như người ta có thể mong đợi, Brazil là quốc gia được yêu thích, với xác suất giành chiến thắng là 42,5%. Kết quả nổi bật này là do Brazil có cả thứ hạng Elo cao nhất và chơi trên sân nhà.

(Hãy đi Brazil!)


3

Rất nhiều người đã nhấn mạnh về những điều có thể dự đoán trong câu trả lời của họ là gì. Bây giờ, với niềm đam mê học tập sâu, ví dụ, bạn có thể sử dụng RNN (nói LSTM) để dự đoán kết quả cho các vấn đề thể thao dựa trên thời gian. Đây là những trạng thái của nghệ thuật và đánh bại các mô hình truyền thống.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.