Phân phối beta từ đâu?


13

Như tôi chắc chắn mọi người ở đây đều đã biết, bản PDF của bản phân phối Beta XB(a,b) được cung cấp bởi

f(x)=1B(a,b)xa1(1x)b1

Tôi đã săn lùng khắp nơi để tìm lời giải thích về nguồn gốc của công thức này, nhưng tôi không thể tìm thấy nó. Mỗi bài viết tôi tìm thấy trên bản phân phối Beta dường như đưa ra công thức này, minh họa một vài hình dạng của nó, sau đó tiếp tục thảo luận về những khoảnh khắc của nó và từ đó.

Tôi không thích sử dụng các công thức toán học mà tôi không thể rút ra và giải thích. Đối với các bản phân phối khác (ví dụ gamma hoặc nhị thức) có một dẫn xuất rõ ràng tôi có thể tìm hiểu và sử dụng. Nhưng tôi không thể tìm thấy bất cứ điều gì như thế cho bản phân phối Beta.

Vì vậy, câu hỏi của tôi là: nguồn gốc của công thức này là gì? Làm thế nào nó có thể được bắt nguồn từ các nguyên tắc đầu tiên trong bất kỳ bối cảnh nào nó được phát triển ban đầu?

[Để làm rõ, tôi không hỏi về cách sử dụng phân phối Beta trong thống kê Bayes, hoặc ý nghĩa của nó trong trực giác trong thực tế (Tôi đã đọc ví dụ về bóng chày). Tôi chỉ muốn biết làm thế nào để lấy được PDF. Có một câu hỏi trước đó đã hỏi một cái gì đó tương tự, nhưng nó được đánh dấu (tôi nghĩ không chính xác) là một bản sao của một câu hỏi khác không giải quyết được vấn đề, vì vậy cho đến nay tôi vẫn chưa thể tìm thấy bất kỳ trợ giúp nào.]

EDIT 2017-05-06: Cảm ơn mọi người vì những câu hỏi. Tôi nghĩ rằng một lời giải thích tốt về những gì tôi muốn đến từ một trong những câu trả lời tôi nhận được khi tôi hỏi điều này trong một số giảng viên khóa học của tôi:

"Tôi đoán mọi người có thể lấy được mật độ bình thường như một giới hạn của tổng n thứ được chia cho sqrt (n) và bạn có thể lấy được mật độ poisson từ ý tưởng về các sự kiện xảy ra với tốc độ không đổi. Tương tự, để lấy được mật độ beta, bạn sẽ phải có một số loại ý tưởng về những gì tạo ra một thứ gì đó phân phối beta một cách độc lập và hợp lý trước khi mật độ. "

Vì vậy, ý tưởng "ab initio" trong các bình luận có lẽ là gần nhất với những gì tôi đang tìm kiếm. Tôi không phải là một nhà toán học, nhưng tôi cảm thấy thoải mái nhất khi sử dụng toán học mà tôi có thể rút ra được. Nếu nguồn gốc quá cao đối với tôi để xử lý, thì cũng vậy, nhưng nếu không tôi muốn hiểu chúng.


5
Bắt nguồn từ cái gì? Nếu cách tiếp cận nhị phân-liên hợp trước không được chấp nhận, một số lựa chọn thay thế ở đây (ví dụ: thống kê thứ tự của một biến ngẫu nhiên thống nhất, tỷ lệ của các biến Gamma).
GeoMatt22

3
Lưu ý: toàn bộ lịch sử phân phối Beta được cung cấp trong trang Wikipedia không thể tin được trên bản phân phối này, trong đó có về mọi chi tiết có thể!
Tây An

1
Câu hỏi trước đó được đánh dấu là một bản sao của câu hỏi khác sau khi OP làm rõ những gì họ đã nhận được sau một bình luận. whuber đã hỏi câu hỏi tương tự ở đó như @ Geomatt22 ở đây: "Đạo hàm có nghĩa là một kết nối logic từ một cái gì đó được giả định đến một cái gì đó được thiết lập. Bạn muốn giả sử cái gì?"
Scortchi - Tái lập Monica

2
@Aksakal nhưng sau đó câu hỏi quá rộng - nó có thể bắt nguồn từ mọi cách; nếu bạn đúng, tôi sẽ đóng nó quá rộng cho đến khi câu hỏi được thu hẹp đủ để trở thành một cái gì đó khác hơn là một túi câu trả lời có thể có
Glen_b -Reinstate Monica

3
Một số thảo luận ngắn gọn về một bối cảnh lịch sử nhỏ ở đây (ít nhất là về mối quan hệ của nó với chức năng beta chưa hoàn chỉnh). Nó có các kết nối với phân phối gamma, và nhiều, nhiều phân phối khác bên cạnh và phát sinh khá hợp lý theo một số cách khác nhau; như Xi'an chỉ ra nó cũng có nguồn gốc lịch sử trong hệ thống Pearson . Những loại câu trả lời bạn đang tìm kiếm ở đây? Những gì đã cho / những gì phải được bắt nguồn?
Glen_b -Reinstate Monica

Câu trả lời:


6

Là một nhà vật lý trước đây, tôi có thể thấy nó có nguồn gốc như thế nào. Đây là cách các nhà vật lý tiến hành:

khi chúng gặp tích phân hữu hạn của hàm dương, chẳng hạn như hàm beta : họ theo bản năng xác định một mật độ: f ( s | x , y ) = s x - 1 ( 1 - s ) y - 1

B(x,y)=01tx1(1t)y1dt
trong đó0<s<1
f(s|x,y)=sx1(1s)y101tx1(1t)y1dt=sx1(1s)y1B(x,y),
0<S<1

Họ làm điều này cho tất cả các loại tích hợp mọi lúc để nó xảy ra theo phản xạ mà không cần suy nghĩ. Họ gọi thủ tục này là "bình thường hóa" hoặc tên tương tự. Lưu ý cách định nghĩa một cách tầm thường, mật độ có tất cả các thuộc tính mà bạn muốn nó có, chẳng hạn như luôn dương và cộng với một.

Mật độ mà tôi đã đưa ra ở trên là phân phối Beta.f(t)

CẬP NHẬT

@ người hỏi có gì đặc biệt về phân phối Beta trong khi logic trên có thể được áp dụng cho vô số tích hợp phù hợp (như tôi đã lưu ý trong câu trả lời của tôi ở trên)?

Phần đặc biệt đến từ phân phối nhị thức . Tôi sẽ viết PDF của nó sử dụng ký hiệu tương tự như phiên bản beta của tôi, không cách viết thông thường cho các thông số và các biến:

f'(x,y|S)= =(y+xx)Sx(1-S)y

Ở đây, - số lần thành công và thất bại, và s - xác suất thành công. Bạn có thể thấy cách này rất giống với tử số trong bản phân phối Beta. Trên thực tế, nếu bạn tìm kiếm bản phân phối Binomial trước, thì đó sẽ là bản phân phối Beta. Nó không ngạc nhiên cũng bởi vì lĩnh vực Beta là 0-1, và đó là những gì bạn làm trong định lý Bayes: tích hợp trên các tham số s , đó là xác suất thành công trong trường hợp này như hình dưới đây: f ( x | X ) = f ( X | s ) f ( s )x,yss ở đâyf(s)- xác suất (mật độ) của xác suất thành công cho các thiết lập trước khi phân phối Beta, vàf'(X|s)- mật độ tập dữ liệu này (nghĩa là thành công và thất bại được quan sát) đưa ra xác suấts.

f^(x|X)= =f'(X|S)f(S)01f'(X|S)f(S)dS,
f(S)f(X|s)S

1
@ Xi'an OP dường như không quan tâm đến lịch sử.
Aksakal

1
"Giải thích về nguồn gốc của công thức này ... trong bất kỳ bối cảnh nào nó được phát triển ban đầu" nghe có vẻ như lịch sử đối với tôi :-).
whuber

3
Tôi tin rằng người ta có thể quan tâm cả về lịch sử và các nguyên tắc đầu tiên cùng một lúc. :-) Mặc dù câu trả lời của bạn là đúng về mặt toán học, nhưng thật không may là quá chung chung: người ta có thể tạo ra mật độ của bất kỳ hàm không âm nào với tích phân hữu hạn. Vậy thì, điều gì đặc biệt về gia đình phân phối đặc biệt này? Như vậy, cách tiếp cận của bạn dường như không thỏa mãn quan điểm nào.
whuber

2
@WillBradshaw, vâng. Thông thường, chúng tôi xem phân phối nhị thức là một hàm của số lần thất bại (hoặc thành công) với xác suất và số lượng thử nghiệm dưới dạng tham số. Bằng cách này, nó là một phân phối rời rạc . Tuy nhiên, nếu bạn xem nó như là một hàm của xác suất với số lần thành công và thất bại dưới dạng tham số, thì nó sẽ trở thành phân phối Beta khi bạn chia tỷ lệ lại, phân phối liên tục , btw.
Aksakal

2
Các bài viết trên Wikipedia về sự phân bố Beta dấu vết nó để Karl Pearson, chính xác theo đề nghị của @ Tây An. Stigler, trong cuốn Lịch sử thống kê: Đo lường sự không chắc chắn trước năm 1900 , đưa ra một tài khoản ngắn gọn về sự phát sinh của Pearson bằng cách sử dụng ký hiệu hiện đại.
whuber

15

nhập mô tả hình ảnh ở đây

-B(một,b)-đề cập đến Wallis (1616-1703), Newton (1642-1726) và Stirling (1692-1770) đối phó với các trường hợp đặc biệt của tích phân thậm chí sớm hơn. Karl Pearson (1895) đưa vào danh mục gia đình này phân bố như Pearson loại I .


F(p,q)

ρ= =σ^12/σ^22pσ^12~χp2qσ^12~χq2
pρq+pρ~B(p/2,q/2)
ω~B(một,b)
ω/một(1-ω)/b~F(2một,2b)
B(một,b)F(p,q)
fp,q(x)α{px/q}p/2-1(1+px/q)-(p+q)/2
y={px/q}{1+px/q}y(0,1)
x=qyp(1y)
dxdy=qp(1y)+qyp(1y)2=pq(1y)2
g(y)yp/21(1y)q/2+1(1y)2=yp/21(1y)q/2+1
[nơi mà tất cả các hằng số chuẩn hóa thu được bằng cách áp đặt mật độ để tích hợp vào một.

2
+1. Có thể đáng chú ý rằng K. Pearson không chỉ đơn thuần là "lập danh mục" các bản phân phối Beta: ông đã đưa ra chúng thông qua các giải pháp của một họ phương trình vi phân lấy cảm hứng từ mối quan hệ mà ông quan sát giữa các phương trình khác biệt cho phương trình nhị phân và phương trình vi phân cho phân phối chuẩn. Tổng quát hóa phương trình sai phân Binomial cho phân bố siêu bội đã tạo ra sự khái quát hóa của phương trình vi phân, với các giải pháp của nó bao gồm các phân phối Beta "Loại I" và "Loại II". Đây chính xác là loại dẫn xuất ab mà OP dường như đang tìm kiếm.
whuber

2
Tôi nghĩ rằng tôi có thể học được rất nhiều bằng cách nghiên cứu câu trả lời này. Hiện tại nó quá tiên tiến đối với tôi, nhưng khi có thời gian tôi sẽ quay lại và nghiên cứu các chủ đề bạn đề cập, sau đó thử lại để hiểu nó. Cảm ơn nhiều. :)
Will Bradshaw

1

Trước hết, tôi không giỏi về các mô tả chính xác về mặt toán học trong đầu, nhưng tôi sẽ cố gắng hết sức bằng một ví dụ đơn giản:

λ

λ=g(x)=λmax(q|xx0|)1q, q>0, 0λλmax
x0q=1/2

x0g(x)P(x0)=Cg(x)p1)P(λ)dλ=P(x0)dx0λ

P(λ)=P(g1(λ))|dg1(λ)dλ|=Cλp1(λmaxλ)q1

Cλmax=1

Nói cách khác, phân phối beta có thể được xem là phân phối xác suất ở trung tâm của phân phối bị xáo trộn.

g(x)P(x0)

g(x)p(x0)

A jitter model leading to the Beta-Poisson spiking model.

P(jitter)g(x)p1λmax=10,p=.6,q=.5λx0λTôi

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.