Có sự thay thế nào cho mô phỏng để xác định phân phối số lượng sự kiện từ hai quá trình Poisson không đồng nhất phụ thuộc không?

8

Một mô hình "hiện đại" để phân phối các bàn thắng ghi được trong một trận bóng đá là "Mô hình quy trình sinh cho các trận đấu bóng đá" của Dixon và Robinson (1998) , chiếm hai hiện tượng chính:

1) Nhiều bàn thắng được ghi vào cuối trận đấu hơn lúc bắt đầu (giả thuyết là do sự mệt mỏi của cả hai đội)

2) Tỷ lệ ghi bàn phụ thuộc vào đường tỷ số hiện tại vì vô số lý do, chẳng hạn như các đội dẫn đầu trở nên tự mãn hoặc các đội thích chơi rút thăm thay vì mạo hiểm thua bằng cách giành chiến thắng

Mô hình giả định rằng các bàn thắng được ghi bởi các đội chủ nhà và sân khách trong một trận đấu tuân theo các quy trình Poisson không đồng nhất. Hãy biểu thị thời gian trôi qua trong một trận đấu, bình thường đến rơi giữa và , các Chiều dài vector biểu thị thời gian mà đội nhà ghi được bàn thắng và Chiều dài vector biểu thị những lần mà đội khách ghi bàn. Khả năng cho trận đấu là sau đó $t$ $0$ $1$ $x$ $\vec{t_H}$ $y$ $\vec{t_A}$

L (\vec{t_{H}}, \vec{t_{A}}) = \exp (- \int_{0}^{1} λ (t) d t) \frac{\prod_{i = 1}^{x} λ ({t_{H}}_{i})}{x!} e x p (- \int_{0}^{1} μ (t) d t) \frac{\prod_{j = 1}^{y} μ ({t_{A}}_{j})}{y!}

$L(\vec{t_H},\vec{t_A}) = \exp\left(-\int_0^1 \lambda(t) dt\right)\frac{\prod_{i=1}^{x} \lambda({t_{H}}_i)}{x!}exp\left(-\int_0^1 \mu(t) dt\right) \frac{\prod_{j=1}^{y} \mu({t_{A}}_j)}{y!}$

Trong đó là tỷ lệ ghi bàn cho đội chủ nhà tại thời điểm phụ thuộc vào sự kết hợp của các yếu tố đồng nhất thời gian (ví dụ: khả năng tấn công của đội chủ nhà so với khả năng phòng ngự của đội khách, lợi thế sân nhà) và các yếu tố không đồng nhất về thời gian (ví dụ như đường tỷ số tại thời điểm ). Tương tự cho . $\lambda(t)$ $t$ $t$ $\mu(t)$

Hai quy trình phụ thuộc bởi vì khi một đội ghi điểm, điểm số sẽ thay đổi và tỷ lệ ghi điểm sẽ phụ thuộc vào điểm số.

Khả năng có thể dễ dàng được đánh giá bằng cách thực hiện tích hợp theo số mũ. Do đó, rất đơn giản để tính toán các tham số của mô hình (khả năng của đội, lợi thế sân nhà, hiệu ứng thời gian, tham số dòng điểm, v.v.) thông qua khả năng tối đa.

Về mặt dự đoán, số lượng quan tâm rõ ràng là:

$P(x > y)$ : đội chủ nhà thắng
$P(x < y)$ : đội khách thắng
$P(x = y)$ : vẽ
Xác suất của các dòng điểm cụ thể, ví dụ $P(x=1,y=0)$
Xác suất của tổng số bàn thắng trong trận đấu, ví dụ $P((x+y) < 2.5)$

Để tính các đại lượng này (xấp xỉ) cho một tập các tham số mô hình, chúng ta có thể sử dụng các phương pháp Monte Carlo để tạo các kết quả khớp theo các quy trình này và sau đó tính tần số của từng điểm số cuối cùng. Mô phỏng từ các quy trình tương đối đơn giản, bằng cách tạo ra các mục tiêu từ một quy trình Poisson đồng nhất bao bọc duy nhất kết hợp với lấy mẫu từ chối và sau đó phân phối chúng cho đội nhà hoặc đội khách phù hợp.

Hạn chế của phương pháp này rõ ràng là gánh nặng tính toán của mô phỏng Monte Carlo. Xem xét việc cố gắng đưa ra dự đoán trong thời gian thực khi các trận đấu đang được chơi, trong đó có thể có nhiều sự kiện xảy ra đồng thời và nó nhanh chóng trở thành một nguyên nhân gây lo ngại.

Do đó, câu hỏi của tôi là liệu có bất kỳ phương pháp thay thế nào mà chúng ta có thể xem xét mà không phát sinh như chi phí tính toán cao (ngay cả khi chúng dựa vào một phép tính gần đúng mà hy sinh độ chính xác để dễ tính toán)?

Để rõ ràng, tôi không tìm kiếm các đề xuất (cơ bản) về cách triển khai hiệu quả mô phỏng Monte Carlo mà tôi đã viết bằng C đa luồng, sử dụng các số bán ngẫu nhiên đã được tạo trước bằng cách sử dụng unrolling và khai thác mỏng dần đạt tỷ lệ chấp nhận rất cao. Nếu bạn nghĩ rằng vẫn còn phạm vi cho sự gia tăng hiệu suất đáng kinh ngạc thì tất nhiên tôi là tất cả nhưng thực sự tôi đang tìm kiếm một cách tiếp cận khác về cơ bản!

monte-carlo poisson-process

— M. Berk
nguồn

1

Đó là một vấn đề thú vị. Tôi không chắc chắn đã nghĩ tất cả những gì bạn muốn nói, nhưng bạn đã nghĩ về việc cải tổ một số vấn đề của bạn như các bài kiểm tra giả thuyết chưa? Giống:

giả thuyết null H0: $x > y$
giả thuyết thay thế H1: $x \le y$

và sau đó để thực hiện một thử nghiệm tỷ lệ khả năng? Sau đó, giá trị p được trích xuất sẽ cho bạn biết liệu H0 có bị từ chối hay không với một mức ý nghĩa nhất định.

Lý do tôi đề cập đến điều này là việc thực hiện kiểm tra tỷ lệ khả năng cũng giống như thực hiện 2 tối thiểu hóa có thể nhanh hơn nhiều so với tích hợp MC. Tuy nhiên, tích phân bên trong exp vẫn có thể yêu cầu tích hợp.

HTH

— Ông Renard
nguồn

0

Trước tiên tôi giải quyết 2 vấn đề với câu hỏi:

Cái gọi là các yếu tố không đồng nhất về thời gian ngăn cản quá trình trở thành Poisson, bởi vì số lượng mục tiêu trong một khoảng thời gian không độc lập với số lượng mục tiêu trước đó. Nói cách khác, tỷ lệ chuyển đổi phụ thuộc vào trạng thái. Ngay cả bài báo được liên kết (P.7) gọi mỗi quá trình là một quá trình sinh, chỉ giảm xuống thành một quá trình Poisson đồng nhất khi cường độ không đổi.
$x!$ vànên được loại trừ khỏi khả năng, như trong biểu thức. (3.5) của bài viết được liên kết. Có lẽ, OP nghĩ rằng phương trình. (3.5) đưa ra khả năng của một trận đấu với một số lần xen kẽ không có thứ tự, sẽ phải chia cho số lượng hoán vị tập hợp để có được khả năng cho một tập hợp được đặt hàng. Điều này là không cần thiết, và sẽ sai ngay cả khi phương trình. (3.5) là khả năng cho một tập hợp không có thứ tự, bởi vì cường độ phụ thuộc vào thời gian sẽ dẫn đến xác suất khác nhau cho mỗi đơn hàng. $y!$

Sau đó, để giải quyết câu hỏi về phân phối dòng điểm, tôi sẽ chỉ ra rằng mặc dù không được đề cập bởi bài viết được liên kết, dòng điểm có thể được mô hình hóa như một quá trình sinh tử :

p_{x, y}^{'} (t) = λ_{x - 1, y} (t) p_{x - 1, y} (t) + μ_{x, y - 1} (t) p_{x, y - 1} (t) - (λ_{x, y} (t) + μ_{x, y} (t)) p_{x, y} (t)

$p_{x,y}'(t)=\lambda_{x-1,y}(t)p_{x-1,y}(t)+\mu_{x,y-1}(t)p_{x,y-1}(t)-(\lambda_{x,y}(t)+\mu_{x,y}(t))p_{x,y}(t)$

p_{x, y} (0) = δ_{x, y}

$p_{x,y}(0)=\delta_{x,y}$

λ_{- 1, y} (t) = 0

$\lambda_{-1,y}(t)=0$

μ_{x, - 1} (t) = 0

$\mu_{x,-1}(t)=0$ Phương trình đầu tiên là cân bằng dân số hoặc phương trình chính, có giải pháp rộng rãi nghiên cứu, ví dụ bởi Feller. Tôi không tin rằng các giải pháp phân tích tồn tại nói chung, trong khi giải pháp số yêu cầu cắt ngắn ở một số và tối đa . Mức tối đa để sử dụng phụ thuộc vào xác suất được tính từ . Ví dụ: chỉ yêu cầu tối đa , yêu cầu tối đa là 2, trong khi ,

x

$x$

y

$y$

p_{x, y} (t)

$p_{x,y}(t)$

p_{1, 0} (t)

$p_{1,0}(t)$

x = 1

$x=1$

P (x + y < 2.5)

$P(x+y<2.5)$

P (x > y)

$P(x>y)$

P (y < x)

$P(y<x)$ và đều yêu cầu cực đại đủ lớn để và không đáng kể.

P (x = y)

$P(x=y)$

p_{x > m a x, y}

$p_{x>max,y}$

p_{x, y > m a x}

$p_{x,y>max}$

Nhiều giải pháp số là có thể, ví dụ phương pháp sai phân / phần tử / phổ hữu hạn. Nếu cực đại lớn là bắt buộc, xấp xỉ các phương trình sai khác với phương trình vi phân trong và liên tục $x$ $y$ có thể hiệu quả hơn.

Dưới đây là một số mã người ta có thể sử dụng làm mẫu, với maxima, và được chỉ định: $\lambda_{x,y}(t)$ $\mu_{x,y}(t)$

max=2;
\[Lambda][x_,y_,t_]=1;
\[Mu][x_,y_,t_]=1;

\[Lambda][-1,y_,t_]=0;
\[Mu][x_,-1,t_]=0;

DSolve[Flatten[Table[{
D[p[x,y,t],t]==\[Lambda][x-1,y,t]p[x-1,y,t]+\[Mu][x,y-1,t]p[x,y-1,t]
             -(\[Lambda][x,y,t]+\[Mu][x,y,t])p[x,y,t],
p[x,y,0]==DiscreteDelta[x,y]},{x,0,max-1},{y,0,max-1}]],
Flatten[Table[p[x,y,t],{x,0,max-1},{y,0,max-1}]],t]

${{p (0, 0, t) \to e^{- 2 t}, p (0, 1, t) \to e^{- 2 t} t, p (1, 0, t) \to e^{- 2 t} t, p (1, 1, t) \to e^{- 2 t} t^{2}}}$ $\left\{\left\{p(0,0,t)\to e^{-2 t},p(0,1,t)\to e^{-2 t} t,p(1,0,t)\to e^{-2 t} t,p(1,1,t)\to e^{-2 t} t^2\right\}\right\}$

— bị lỗi thời
nguồn