Làm thế nào để thực hiện chức năng siêu bội tổng quát để sử dụng trong beta-binomial cdf, sf, ppf?

Tôi đang viết một lớp con scipy.stats._distn_infrastructure.rv_discretecho phân phối nhị thức beta có PMF là

P (X = k ∣ N, α, β) (\binom{N}{k}) \frac{B (k + α, N - k + β)}{B (α, β)},

$P(X=k \mid N, \alpha, \beta){N \choose k} \frac{\mathrm{B}(k+\alpha,N-k+\beta)}{\mathrm{B}(\alpha,\beta)},$

Trong đó $\mathrm{B}$ là hàm Beta. Việc triển khai CDF và SF hiện tại của tôi (chức năng sinh tồn, tương đương với 1 - CDF) là không chính xác; chiến lược tôi sử dụng sẽ tính toán giá trị kỳ vọng của cdf nhị thức đối với thành phần beta:

P_{B B} (X \leq k ∣ N, α, β) = E_{p} [P_{B i n o m} (X \leq k ∣ N, p)],

$P_{BB}(X \le k \mid N, \alpha, \beta) = E_p\left[P_{Binom}(X \le k \mid N, p)\right],$ trong đó

p \sim B e t a (α, β)

$p \sim \mathrm{Beta}(\alpha, \beta)$ . Tôi đạt được điều này bằng cách sử dụng scipy.stats.beta.expectphương thức không được vector hóa hoàn toàn (nó sẽ sụp đổ trên bất cứ thứ gì ngoài mảng float hoặc 0d).

PPF thậm chí còn tệ hơn - đó là một vòng lặp mạnh mẽ trên các số nguyên $k=0, \ldots, N$ sao cho

P (X \leq k ∣ N, α, β) \leq q .

$P(X\le k \mid N, \alpha, \beta) \le q.$

Theo Wikipedia, chức năng sinh tồn cho phân phối nhị thức beta là

P (X > k ∣ N, α, β) = \frac{B (β + n - k - 1, α + k + 1)_{3} F_{2} (a, b; k)}{B (α, β) B (n - k, k + 2) (n + 1)},

$P(X > k \mid N, \alpha, \beta) = \frac{\mathrm{B}(\beta+n-k-1,\alpha+k+1)_3F_2(\boldsymbol{a},\boldsymbol{b};k)} {\mathrm{B}(\alpha,\beta)\mathrm{B}(n-k,k+2) (n+1)},$

trong đó là hàm siêu bội tổng quát. Có cách nào hiệu quả để tính toán điều này trong Python, vì vậy tôi có thể xóa tham chiếu đến không? Ngoài ra, làm cách nào để đảo ngược hàm này để giải quyết cho cho ? ${}_3F_2$ beta.expect $k$ $q=P(X \le k\mid N, \alpha, \beta)$

— Scott Norton
nguồn

Có thể giúp biết rằng đối với các giá trị của mà (ngầm) xuất hiện ở đây, là một đa thức trong (độ , ). Nó không đơn giản hóa nói chung.

a, b

$\boldsymbol{a},\boldsymbol{b}$

_{3} F_{2} (;; z)

$_3F_2(;;z)$

z

$z$

n - k - 1

$n-k-1$

- 1 \leq k \leq n - 1

$-1\le k \le n-1$

— whuber

Bạn đã tìm thấy bất kỳ giải pháp cho câu hỏi của bạn? Nếu có, có lẽ bạn muốn chia sẻ nó như một câu trả lời cho câu hỏi của bạn?

— Tim

Điều này không trả lời trực tiếp câu hỏi của bạn, nhưng nếu bạn đang nghĩ đến việc ước tính hàm phân phối tích lũy của beta-binomial hiệu quả hơn, thì bạn có thể sử dụng thuật toán đệ quy hiệu quả hơn một chút so với triển khai ngây thơ.

Lưu ý rằng hàm khối lượng xác suất của phân phối nhị thức beta

f (x) = (\binom{n}{x}) \frac{B (x + α, n - x + β)}{B (α, β)}

$f(x) = {n \choose x} \frac{\mathrm{B}(x+\alpha, n-x+\beta)}{\mathrm{B}(\alpha, \beta)}$

có thể được viết lại nếu bạn nhớ rằng vàvà , để nó trở thành $\mathrm{B}(x,y)=\tfrac{\Gamma(x)\,\Gamma(y)}{\Gamma(x+y)}$ $\Gamma(x) = (x-1)!$ ${n \choose k} = \prod_{i=1}^k \tfrac{n+1-i}{i}$

f (x) = (\prod_{i = 1}^{x} \frac{n + 1 - i}{i}) \frac{\frac{(α + x - 1)! (β + n - x - 1)!}{(α + β + n - 1)!}}{B (α, β)}

$f(x) = \left( \prod_{i=1}^x \frac{n+1-i}{i} \right) \frac{\frac{(\alpha+x-1)!\,(\beta+n-x-1)!}{(\alpha+\beta+n-1)!}}{\mathrm{B}(\alpha,\beta)}$

điều này giúp việc cập nhật từ lên dễ dàng $x$ $x+1$

f (x + 1) = (\prod_{i = 1}^{x} \frac{n + 1 - i}{i}) \frac{n + 1 - x + 1}{x + 1} \frac{\frac{(α + x - 1)! (α + x) (β + n - x - 1)! (β + n - x)^{- 1}}{(α + β + n - 1)! (α + β + n)}}{B (α, β)}

$f(x\color{red}{+1}) = \left( \prod_{i=1}^x \frac{n+1-i}{i} \right) \color{red}{\frac{n+1-x+1}{x+1}} \frac{\frac{(\alpha+x-1)! \,\color{red}{(\alpha+x)}\,(\beta+n-x-1)! \, \color{red}{(\beta+n-x)^{-1}}}{(\alpha+\beta+n-1)!\,\color{red}{(\alpha+\beta+n)}}}{\mathrm{B}(\alpha,\beta)}$

và sử dụng điều này, bạn có thể tính toán hàm phân phối tích lũy như

F (x) = \sum_{k = 0}^{x} f (k)

$F(x) = \sum_{k=0}^x f(k)$

chỉ sử dụng các phép toán số học đơn giản thay vì tính toán các hàm chuyên sâu cho máy tính.

Sidenote: khi xử lý số lớn, bạn sẽ gặp các vấn đề về độ chính xác số, do đó, mã mạnh hơn sẽ cần làm việc với logarit, nhưng ngay cả khi bạn có thể mong đợi cải thiện hiệu quả (mã nhanh hơn gấp 2 đến 3 lần khi tôi chạy vài điểm chuẩn Mã C ++ thực hiện nó so với triển khai ngây thơ).

— Tim
nguồn

Một lưu ý khác. Tỷ lệ tích phân beta cho thuật ngữ đầu tiên là một sản phẩm đơn giản khác điều này đơn giản hóa thành

f (0) = \frac{B (a, n + b)}{B (a, b)} = \frac{Γ (n + b) Γ (a + b)}{Γ (n + a + b) Γ (b)}

$f (0)=\frac {B (a,n+b)}{B (a,b)}=\frac {\Gamma (n+b)\Gamma (a+b)}{\Gamma (n+a+b)\Gamma (b)}$

\prod_{j = 1}^{n} \frac{n + b - j}{n + a + b - j}

$\prod_{j=1}^n\frac {n+b-j}{n+a+b-j}$

— xác suất