Tại sao PDF của Dirichlet Distribution dường như không tích hợp với 1?


8

Tôi đã cố gắng tìm giá trị mong đợi của một hàm của một biến ngẫu nhiên có phân phối Dirichlet bằng cách tích hợp sản phẩm của nó với hàm mật độ Dirichlet trên một đơn giản trong R.

Để kiểm tra tôi đã áp dụng đúng hàm trong R, tôi đã thử tích hợp hàm mật độ trên toàn bộ đơn giản, hy vọng sẽ có được 1, tuy nhiên tôi vẫn nhận được hàm mật độ cho phân phối Dirichlet với n loại được tích hợp vào sqrt (n) (sử dụng Gói R SimplicialCubature).

Tôi giả sử điều này phải sai, nhưng sau đó tôi đã xem xét hàm mật độ cho 2 loại, xem xét trường hợp trong đó alphas = (1,1). Sau đó, hàm mật độ là 1 (lấy hàm mật độ từ https://en.wikipedia.org/wiki/Dirichlet_distribution ). Vì vậy, tích phân của hàm mật độ trên 1 đơn giản chỉ cho độ dài của 1 đơn giản. Nhưng đây là sqrt (2), như tôi đã tìm thấy với mã R.

Tôi đang thiếu gì ở đây?

Câu trả lời:


12

Với hai biến, bạn đang xác định một phân đoạn dòng trong , như bạn đã chỉ ra. Tuy nhiên, do ràng buộc đơn giản, một trong hai biến này là dư thừa về mặt chỉ định mật độ, vì có mối quan hệ một đối một giữa x 1x 2 . Do đó, mật độ được chỉ định trên K - 1 biến miễn phí (nghĩa là trong R )R2x1x2K1R

Điều này thực sự được chỉ ra trong dòng đầu tiên của phần này của bài viết Wikipedia, mặc dù rất tinh tế.

Do đó, hàm mật độ của bạn trở thành :.

Dir1,1(x1,1x1)=Γ(2)Γ(1)2(x1)0(1x1)0=1

Vì thế,

01Dir1,1(x1,1x1)dx1=1

Trả lời bình luận của OP

Do các ràng buộc đơn giản, mật độ Dirichlet hai biến thực sự bị suy giảm trong , như thể hiện trong cách xây dựng của tôi ở trên (nó chỉ yêu cầu một biến). Mặc dù đúng là nó có mật độ 1 , nhưng nó không có mật độ 1 trên đoạn đường nối ( 1 , 0 ) với ( 0 , 1 ) . Những gì công trình trên cho thấy là mật độ biên có giá trị là 1 . Sự nhầm lẫn của bạn xuất phát từ suy nghĩ về x 2 như một biến miễn phí, trong trường hợp đó là sự hỗ trợ của Dirichlet trênR211(1,0)(0,1)1x2 sẽ có diện tích khác không. Trực giác này là tốt trong các trường hợp như gaussian bivariate, trong đó hai biến không tương quan hoàn hảo, nhưng không phải trong trường hợp này.R2

Chúng tôi có thể chính thức rút ra điều này như sau:

Hãy có một số số trong [ 0 , L[0,2](1,0)(0,1)L(x1,x2)1

P(L[a,b])=ba

x1,x2

PL(L[a,b])=PX1,X2[(x1,x2)A[a,b]]

A[a,b]:={(u,v):u[1b2,1a2],v=1u]

PL(L[a,b])

PL(L[a,b])=A[a,b]dPX1,X2=A[a,b]dPX1dPX2|X1=A[a,b]1dPX1=1b21a21du=

(1a2)(1b2)=12(ba)

dPX2|X1=1X2=1X11X1

12R212


1
Rất cám ơn, tôi đồng ý với logic của những gì bạn đã viết, nhưng tôi không thể bình luận rằng trong thực tế rằng hàm có giá trị không đổi 1 và dòng có độ dài sqrt (2). Vậy tại sao không nên tích hợp cho sqrt (2) ??
EBartrum

@EBartrum Tôi sẽ thêm một số làm rõ vào khoảng 7:30 EDT

3
@EBartrum đã thêm một số chi tiết để làm tròn bài đăng (Tôi biết bạn đã chấp nhận, nhưng những người khác có thể muốn biết thêm chi tiết)
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.