Mối quan hệ giữa các bản phân phối Binomial và Beta


27

Tôi là một lập trình viên nhiều hơn là một nhà thống kê, vì vậy tôi hy vọng câu hỏi này không quá ngây thơ.

Nó xảy ra trong việc thực hiện chương trình lấy mẫu tại các thời điểm ngẫu nhiên. Nếu tôi lấy N = 10 mẫu thời gian ngẫu nhiên về trạng thái của chương trình, tôi có thể thấy hàm Foo được thực thi trên, ví dụ, I = 3 trong số các mẫu đó. Tôi quan tâm đến những gì cho tôi biết về phần thời gian thực tế mà Foo đang thực hiện.

Tôi hiểu rằng tôi được phân phối nhị thức với trung bình F * N. Tôi cũng biết rằng, với I và N, F tuân theo phân phối beta. Trong thực tế, tôi đã xác minh bằng chương trình mối quan hệ giữa hai phân phối đó, đó là

cdfBeta(I, N-I+1, F) + cdfBinomial(N, F, I-1) = 1

Vấn đề là tôi không có cảm giác trực quan cho mối quan hệ. Tôi không thể "hình ảnh" tại sao nó hoạt động.

EDIT: Tất cả các câu trả lời đều đầy thách thức, đặc biệt là @ whuber, mà tôi vẫn cần phải mò mẫm, nhưng đưa ra số liệu thống kê theo thứ tự là rất hữu ích. Tuy nhiên, tôi đã nhận ra rằng tôi nên hỏi một câu hỏi cơ bản hơn: Cho tôi và N, phân phối cho F là gì? Mọi người đã chỉ ra rằng đó là bản Beta, mà tôi biết. Cuối cùng tôi đã tìm ra từ Wikipedia ( Liên hợp trước ) rằng nó dường như là Beta(I+1, N-I+1). Sau khi khám phá nó với một chương trình, nó dường như là câu trả lời đúng. Vì vậy, tôi muốn biết nếu tôi sai. Và, tôi vẫn còn bối rối về mối quan hệ giữa hai cdf được hiển thị ở trên, tại sao chúng lại tổng hợp thành 1 và liệu chúng có liên quan gì đến những gì tôi thực sự muốn biết không.


Nếu "những gì bạn thực sự muốn biết" là "phần thời gian thực tế mà Foo đang thực hiện", thì bạn đang hỏi về khoảng tin cậy Binomial hoặc khoảng tin cậy Binomial (Bayesian).
whuber

@whuber: Vâng, tôi đã sử dụng phương pháp tạm dừng ngẫu nhiên để điều chỉnh hiệu suất trong hơn 3 thập kỷ và một số người khác cũng đã phát hiện ra nó. Tôi đã nói với mọi người rằng nếu một số điều kiện là đúng trên 2 mẫu thời gian ngẫu nhiên trở lên, thì việc loại bỏ nó sẽ tiết kiệm được một phần thời gian tốt. Làm thế nào tốt một phần là những gì tôi đã cố gắng để được rõ ràng về, giả sử chúng ta không biết một Bayes trước. Đây là ngọn lửa chung: stackoverflow.com/questions/375913/ , và stackoverflow.com/questions/1777556/alternigin-to-gprof/ Lỗi
Mike Dunlavey

1
Ý kiến ​​hay. Giả định thống kê là sự gián đoạn độc lập với trạng thái thực thi, đó là một giả thuyết hợp lý. Khoảng tin cậy nhị thức là một công cụ tốt để sử dụng để thể hiện độ không đảm bảo. (Nó cũng có thể là một cái mở mắt: trong tình huống 3/10 của bạn, CI 95% hai mặt đối xứng cho xác suất thực là [6,7%, 65,2%]. Trong tình huống 2/10, khoảng cách là [2,5 %, 55,6%]. Đây là các phạm vi rộng! Ngay cả với 2/3, giới hạn dưới vẫn dưới 10%. Bài học ở đây là một điều khá hiếm có thể xảy ra hai lần.)
whuber

@whuber: Cảm ơn. Bạn đúng. Một cái gì đó hữu ích hơn là giá trị mong đợi. Theo như các linh mục, tôi chỉ ra rằng nếu bạn chỉ nhìn thấy một cái gì đó, nó sẽ không cho bạn biết nhiều trừ khi bạn biết chương trình nằm trong một vòng lặp vô hạn (hoặc quá dài).
Mike Dunlavey

Tôi nghĩ rằng tất cả các câu trả lời và nhận xét chắc chắn đã được khai sáng và chính xác, nhưng không ai thực sự chạm vào sự bình đẳng thú vị mà @MikeDunlavey đưa vào bài viết gốc của mình. Sự bình đẳng này có thể được tìm thấy trên Beta wikipedia en.wikipedia.org/wiki/Beta_feft#Incomplete_beta_feft nhưng không có mô tả nào về lý do tại sao, đó chỉ là một thuộc tính.
bdeonovic

Câu trả lời:


27

Xem xét số liệu thống kê theo thứ tự của n + 1 độc lập rút ra từ một phân bố đều. Vì thống kê đơn hàng có phân phối Beta , nên khả năng x [ k ] không vượt quá p được đưa ra bởi tích phân Betax[0]x[1]x[n]n+1x[k]p

Pr[x[k]p]=1B(k+1,nk+1)0pxk(1x)nkdx.

(Tại sao lại như vậy? Đây là một minh chứng không nghiêm ngặt nhưng đáng nhớ. Cơ hội mà nằm giữa pp + d p là cơ hội trong số các giá trị đồng nhất n + 1 , k trong số chúng nằm giữa 0p , ít nhất một trong số chúng nằm giữa pp + d p , và phần còn lại nằm giữa p + d p1. Để đặt hàng đầu tiên trong d p vô hạnx[k]pp+dpn+1k0ppp+dpp+dp1dpchúng ta chỉ cần xem xét trường hợp chính xác một giá trị (cụ thể là ) nằm giữa pp + d p và do đó giá trị n - k vượt quá p + d p . Vì tất cả các giá trị là độc lập và đồng nhất, xác suất này tỷ lệ thuận với p k ( d p ) ( 1 - p - d p ) n - k . Để thứ tự đầu tiên trong d p này bằng px[k]pp+dpnkp+dppk(dp)(1pdp)nkdp , chính xác là tích phân của phân phối Beta. Học kỳ 1pk(1p)nkdp có thể được tính trực tiếp từ đối số này dưới dạng hệ số đa thức ( n + 11B(k+1,nk+1)hoặc xuất phát gián tiếp là hằng số chuẩn hóa của tích phân.)(n+1k,1,nk)

Theo định nghĩa, sự kiện k + 1 st giá trị không vượt quá p . Tương đương, ít nhất k + 1 trong các giá trị không vượt quá p : khẳng định đơn giản (và tôi hy vọng rõ ràng này) cung cấp trực giác mà bạn tìm kiếm. Xác suất của câu lệnh tương đương được đưa ra bởi phân phối Binomial,x[k]pk+1stp k+1p

Pr[at least k+1 of the xip]=j=k+1n+1(n+1j)pj(1p)n+1j.

Tóm lại , tích phân Beta chia phép tính của một sự kiện thành một chuỗi các phép tính: tìm ít nhất các giá trị trong phạm vi [ 0 , p ] , có xác suất mà chúng ta thường sẽ tính toán với cdf Binomial, được chia thành hai lần trường hợp độc quyền mà chính xác k các giá trị nằm trong khoảng [ 0 , x ] và 1 giá trị nằm trong khoảng [ x , x + d x ] cho tất cả các thể x , 0 x < pk+1[0,p] k[0,x][x,x+dx]x0x<p là một chiều dài vô hạn. Tổng hợp trên tất cả các "cửa sổ" [ x , x + d x ] - đó là, tích hợp - phải đưa ra xác suất tương tự như cdf Binomial.dx[x,x+dx]

alt text


Tôi đánh giá cao những nỗ lực. Tôi sẽ phải thực sự nghiên cứu điều này bởi vì nó không phải là "tiếng mẹ đẻ" của tôi. Ngoài ra, tôi đang nhìn thấy rất nhiều ký hiệu đô la và công cụ định dạng. Có điều gì đó tôi không biết về nó làm cho nó trông giống như toán học thực sự?
Mike Dunlavey

Chuyện gì đã xảy ra? Đột nhiên, toán học xuất hiện và gõ vào đây rất chậm.
Mike Dunlavey


Tôi sửa đổi câu hỏi, nếu bạn quan tâm để xem. Cảm ơn.
Mike Dunlavey

1
Hơi muộn một chút, nhưng cuối cùng tôi cũng có thời gian để ngồi xuống và tạo lại cuộc tranh luận của bạn. Chìa khóa là "hệ số đa cực". Tôi đã cố gắng tìm ra nó bằng cách sử dụng các hệ số nhị thức cũ đơn giản và tôi đã nhận được tất cả. Cảm ơn một lần nữa cho một câu trả lời tốt đẹp.
Mike Dunlavey

12

Hãy xem pdf của Binomial là hàm của : f ( x ) = ( nxvà pdf của Beta là một hàm củap:g(p)=Γ(một+b)

f(x)=(nx)px(1p)nx
p Bạn có lẽ có thể thấy rằng với một sự lựa chọn thích hợp (số nguyên) chomộtbđều giống nhau. Theo như tôi có thể nói, đó là tất cả những gì có liên quan đến mối quan hệ này: cáchpđi vào pdf nhị thức chỉ tình cờ được gọi là bản phân phối Beta.
g(p)=Γ(a+b)Γ(a)Γ(b)pa1(1p)b1
abp

Tôi biết những cái đó trông gần giống nhau, nhưng nếu tôi thay thế y cho nx và nếu tôi lấy Beta pdf và thay thế x cho a-1 và y cho b-1, tôi nhận được một yếu tố phụ là (x + y + 1), hoặc n + 1. tức là (x + y + 1)! / x! / y! * p ^ x * q ^ y. Điều đó dường như là đủ để ném tôi đi.
Mike Dunlavey

1
Có thể ai đó sẽ đồng ý với một phản hồi đầy đủ, nhưng trong một lời giải thích "trực quan", chúng ta luôn có thể truyền tay các hằng số (như ) không phụ thuộc vào các biến quan tâm ( xp ), nhưng được yêu cầu làm cho pdf thêm / tích hợp thành 1. Hãy thoải mái thay thế các dấu "bằng" bằng các dấu "tỷ lệ với". n+1xp
Aniko

Điểm tốt. Tôi nghĩ rằng tôi đang tiến gần hơn đến một sự hiểu biết. Tôi vẫn đang cố gắng để có thể nói những gì x nói với bạn về phân phối p và tại sao hai cdf đó lại tổng hợp thành 1.
Mike Dunlavey

1
Tôi có một cái nhìn khác về giải thích "trực quan". Trong một số trường hợp, chúng tôi không quan tâm quá nhiều đến các hằng số, nhưng trong trường hợp này, mấu chốt của vấn đề là xem tại sao n + 1 xuất hiện mà không phải là n. Nếu bạn không hiểu điều đó thì "trực giác" của bạn không chính xác.
whuber

Tôi sửa đổi câu hỏi, nếu bạn quan tâm để xem. Cảm ơn.
Mike Dunlavey

5

Như bạn đã nói, sự phân bố Beta mô tả sự phân bố xác suất thử nghiệm tham số , trong khi phân phối nhị thức mô tả sự phân bố về kết quả tham số tôi . Viết lại câu hỏi của bạn, điều bạn hỏi là tại sao P ( F i + 1FIP(Fni+1)+P(I+1fn)=1P(Fni+1)=P(fn<Tôi+1)

P(Fi+1n)+P(Ifn1)=1
P(Fni+1)+P(I+1fn)=1
P(Fni+1)=P(fn<I+1)
Nghĩa là, khả năng quan sát cộng với một lớn hơn kỳ vọng của quan sát cũng giống như khả năng quan sát cộng với một quan sát lớn hơn mong đợi của quan sát.

Tôi thừa nhận rằng điều này có thể không giúp ích cho công thức ban đầu của vấn đề, nhưng có lẽ nó ít nhất giúp xem hai bản phân phối sử dụng cùng một mô hình cơ bản của các thử nghiệm Bernoulli lặp đi lặp lại để mô tả hành vi của các tham số khác nhau.


Tôi đánh giá cao của bạn về nó. Tất cả các câu trả lời đang giúp tôi suy nghĩ về câu hỏi và có thể hiểu rõ hơn những gì tôi đang hỏi.
Mike Dunlavey

Tôi sửa đổi câu hỏi, nếu bạn quan tâm để xem. Cảm ơn.
Mike Dunlavey

1
Về sửa đổi của bạn: Có, F~Betmột(tôi+1,N-tôi+1), miễn là khoảng thời gian lấy mẫu của bạn đủ dài để mỗi quan sát là độc lập và phân phối giống hệt nhau. Lưu ý rằng nếu bạn muốn là Bayesian về nó và chỉ định phân phối trước đó không theo mẫu cho tỷ lệ bạn mong đợi, bạn có thể thêm một số thứ khác vào cả hai tham số.
Sesqu

@sesqu, có thể câu trả lời của bạn được bằng cách nào đó liên quan đến câu hỏi của tôi ở đây: stats.stackexchange.com/questions/147978/... ? Tôi sẽ đánh giá cao suy nghĩ của bạn về nó.
Vicent

1

Ở vùng đất Bayes, phân phối Beta là liên hợp trước cho tham số p của phân phối Binomial.


2
Có, nhưng tại sao lại như vậy?
vonjd

1

Không thể nhận xét về các câu trả lời khác, vì vậy tôi phải tạo câu trả lời của riêng mình.

Posterior = C * Likabilities * Prior (C là hằng số làm cho Posterior được tích hợp thành 1)

Đưa ra một mô hình sử dụng phân phối Binomial cho khả năng và phân phối Beta cho Ưu tiên. Sản phẩm của hai sản phẩm tạo ra Posterior cũng là bản phân phối Beta. Vì Prior và Posterior đều là Beta, và do đó chúng là các bản phân phối liên hợp . Prior (Beta) được gọi là liên hợp trước cho khả năng (Binomial). Ví dụ: nếu bạn nhân Beta với Bình thường, Posterior không còn là Beta nữa. Tóm lại, Beta và Binomial là hai bản phân phối thường được sử dụng trong suy luận Bayes. Beta là Conjugate Prior of Binomial, nhưng hai bản phân phối không phải là tập hợp con hoặc superset của cái kia.

Ý tưởng chính của suy luận Bayes là chúng ta đang coi tham số p là một biến ngẫu nhiên nằm trong khoảng [0,1] trái với cách tiếp cận suy luận thường xuyên trong đó chúng ta đang coi tham số p là cố định. Nếu bạn nhìn kỹ vào các thuộc tính của bản phân phối Beta, bạn sẽ thấy Ý nghĩa và Chế độ của nó chỉ được xác định bởiαβkhông liên quan đến tham số p . Điều này, cùng với tính linh hoạt của nó, là lý do tại sao Beta thường được sử dụng làm Ưu tiên.


1

Tóm tắt: Người ta thường nói rằng phân phối Beta là phân phối trên các bản phân phối! Nhưng có nghĩa là gì?

Về cơ bản nó có nghĩa là bạn có thể sửa chữa n,k và nghĩ về P[Bin(n,p)k] as a function of p. What the calculation below says is that the value of P[Bin(n,p)k] increases from 0 to 1 when you tune p from 0 to 1. The increasing rate at each p is exactly β(k,nk+1) at that p.

enter image description here


Let Bin(n,p) denote a Binomial random variable with n samples and the probability of success p. Using basic algebra we have

ddpP[Bin(n,p)=i]=n(P[Bin(n1,p)=i1]P[Bin(n1,p)=i]).

It has also some nice combinatorial proof, think of it as an exercise!

So, we have:

ddpP[Bin(n,p)k]=ddpi=knP[Bin(n,p)=i]=n(i=knP[Bin(n1,p)=i1]P[Bin(n1,p)=i])
which is a telescoping series and can be simplified as

ddpP[Bin(n,p)k]=nP[Bin(n1,p)=k1]=n!(k1)!(nk)!pk1(1p)nk=β(k,nk+1).


Remark To see an interactive version of the plot look at this. You may download the notebook or just use the Binder link.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.