Suy luận Bayes về tổng các biến ngẫu nhiên có giá trị thực iid


8

Đặt , , ..., là iid RV với phạm vi nhưng phân phối không xác định. (Tôi đồng ý với việc giả định rằng việc phân phối là liên tục, v.v., nếu cần.)X 2 X n [ 0 , 1 ]X1X2Xn[0,1]

Xác định .Sn=X1++Xn

Tôi được đưa cho và hỏi: Tôi có thể suy ra điều gì, theo cách nói của Bayes, về ?S nSkSn

Đó là, tôi được trao tổng của một mẫu có kích thước của RV, và tôi muốn biết những gì tôi có thể suy luận về việc phân phối tổng của tất cả các RV, sử dụng phương pháp Bayes (và giả sử các linh mục hợp lý về phân phối).k

Nếu hỗ trợ là thay vì , thì vấn đề này được nghiên cứu kỹ và (với các linh mục thống nhất) bạn có được các bản phân phối hợp chất beta-nhị thức cho phân phối được suy ra trên . Nhưng tôi không chắc cách tiếp cận nó với như phạm vi ...[ 0 , 1 ] S n [ 0 , 1 ]{0,1}[0,1]Sn[0,1]

Tiết lộ đầy đủ : Tôi đã đăng bài này trên MathOverflow , nhưng được thông báo rằng nó sẽ được đăng tốt hơn ở đây, vì vậy đây là một bài đăng lại.


Tôi đã định viết bình luận cho bạn trên MO, nhưng tôi sẽ viết nó ở đây để thay thế. Nếu bạn cảm thấy câu hỏi phù hợp hơn với diễn đàn này, bạn có thể gắn cờ nó trên MO và yêu cầu đóng lại.
Đức Hồng Y

1
Tôi muốn làm rõ một số tuyên bố cuối cùng của bạn. Nếu phạm vi là thì bất kỳ phân phối nào đặt bất kỳ khối lượng nào lên các giá trị không nằm trong cho phân phối có vẻ ngớ ngẩn, vì vậy tôi tự hỏi liệu tôi ' đã hiểu mục tiêu của bạn một cách chính xác. (Có lẽ một tài liệu tham khảo sẽ hữu ích.){ 0 , 1 , Hoài , n } S k{0,1}{0,1,,n}Sk
Hồng y

Tôi đã hiểu lầm điều gì?
Đức Hồng Y

1
Bạn có quan tâm đến phi thông số Bayes? Nếu bạn không muốn đưa ra các giả định về việc phân phối , bạn cần một khung không tham số. Nhưng sau đó, chỉ được cung cấp bạn không thể nói nhiều ...S kXkSk
Xi'an

1
Đây là những nhận xét tốt; xin lỗi rằng vấn đề là một chút sai lầm. Tôi đã nghĩ rằng n rất lớn so với và rằng phần sau trên sẽ phản ánh trực tiếp phần sau về các tham số. Có lẽ thay vì tôi nên sử dụng và yêu cầu hậu thế trên khi đi đến vô cùng. Điều này có ý nghĩa bây giờ? kSnSnSn=Sn/nlimSnn
Ronald L Rivest

Câu trả lời:


2

Hãy xem xét các phân tích phi tham số Bayes sau đây.

Xác định và đặt là tập con Borel của . Đặt là số đo hữu hạn khác không .B X α ( X , B )X=[0,1]BXα(X,B)

Đặt là một quá trình Dirichlet với tham số và giả sử rằng là iid có điều kiện, với điều kiện , sao cho , với mọi .α X 1 , Hoài , X n Q = q μ X 1 ( B ) = P { X 1B } = q ( B ) B BQαX1,,XnQ=qμX1(B)=P{X1B}=q(B)BB

Từ các thuộc tính của quy trình Dirichlet, chúng tôi biết rằng, với , phân phối dự đoán của một quan sát trong tương lai như là thước đo over được xác định bởi X k + 1 β ( X , B ) β ( B ) = 1X1,,XkXk+1β(X,B)

β(B)=1α(X)+k(α(B)+i=1kIB(Xi)).

Bây giờ, hãy xác định là trường sigma được tạo bởi và sử dụng phép đo và tính đối xứng của để lấy gần như chắc chắn.X 1 ,..., X k X i E [ S n | F k ] = S k +E [ n Σ i = k + 1 X iFkX1,,XkXi

E[SnFk]=Sk+E[i=k+1nXi|Fk]=Sk+(nk)E[Xk+1Fk],

Để tìm câu trả lời rõ ràng, giả sử rằng là . Xác định , chúng ta có gần như chắc chắn (phân phối chung của ), trong đó . Trong giới hạn "không phù hợp" của , kỳ vọng trước đây giảm xuống , điều đó có nghĩa là, trong trường hợp này, dự đoán sau của bạn cho chỉ gấp lần giá trị trung bình của đầu tiênU [ 0 , 1 ] c = α ( X ) > 0 E [ S nX 1 = x 1 , Trà , X k = x k ] = s k + n - kα()/α(X)U[0,1]c=α(X)>0[ Μ X 1 , ... , X k ] X 1 , ... , X k s k = x 1 + + x k c 0 n ( s k / k ) S n n k

E[SnX1=x1,,Xk=xk]=sk+nkc+k(c2+sk),
[μX1,,Xk]X1,,Xksk=x1++xkc0n(sk/k)Snnk các quan sát, trông giống như trực quan nhất có thể.

Có thể nhận được một biểu thức đẹp cho trong mô hình này không? Var[Sn|Sk]
Cyan

1

Tha thứ cho việc thiếu lý thuyết đo lường và lạm dụng ký hiệu ở bên dưới ...

Vì đây là suy luận Bayes, nên phải có một số ưu tiên chưa biết trong vấn đề, trong trường hợp này là phân phối , một tham số vô hạn lấy các giá trị trong tập phân phối trên (gọi nó là ). Phân phối dữ liệu hội tụ thành một phân phối bình thường, vì vậy nếu đủ lớn ( định lý Berry-Esseen ), chúng ta chỉ có thể tát vào đó một cách gần đúng. Hơn nữa, nếu phép tính gần đúng là chính xác thì khía cạnh duy nhất của đó quan trọng về mặt thực tế là cảm ứng trước trên .X1[0,1]πSk|πkp(π)(Eπ(X1),Varπ(X1))=(μ,σ2)

Bây giờ chúng tôi thực hiện dự đoán Bayes tiêu chuẩn và đưa vào mật độ gần đúng. ( có cùng xấp xỉ với .)SnSk

p(Sn|Sk)=p(π|Sk)p(Sn|π,Sk)dπ

p(Sn|Sk)=p(π)p(Sk|π)p(Sk)p(Sn|π,Sk)dπ

p(Sn|Sk)p(μ,σ2)N(Sk|kμ,kσ2)N(Sn|(nk)μ+Sk,(nk)σ2)d(μ,σ2)p(μ,σ2)N(Sk|kμ,kσ2)d(μ,σ2)

Đối với các giới hạn của tích phân , rõ ràng ; Tôi nghĩ ?μ[0,1]σ2[0,14]

Đã thêm sau: không,Điều này thật tuyệt - các giá trị được phép của phụ thuộc vào , vì vậy thông tin trong dữ liệu về cũng có liên quan đến .σ2[0,μ(1μ)].σ2μμσ2


1
Tôi không hiểu đoạn chính của bạn. Trước hết, sự hội tụ thành bình thường chỉ sau một sự thay đổi và giải cứu và đây không phải là định lý Berry - Esseen (là một định lý về tốc độ hội tụ thành bình thường), mà là CLT. Hơn nữa, sự thay đổi và bán lại sẽ phụ thuộc vào tham số cố định cụ thể. Bạn đã xem xét một trường hợp mà bạn có, giả sử, ba điểm trước được phân phối đồng đều trên ? Sn{0,1/2,1}
Đức hồng y

Hãy để tôi làm rõ rằng khi tôi viết "bình thường" tôi không có nghĩa là tiêu chuẩn bình thường. Vì vậy, sự thay đổi và quy mô lại thay đổi trung bình và phương sai nhưng sự hội tụ vẫn là một số yếu tố trong gia đình phân phối bình thường. Ý tôi là liên kết đến định lý Berry-Esseen để tham chiếu cụm từ "nếu đủ lớn"; vị trí hiện tại của nó là một lỗi cut-n-paste và tôi sẽ thay đổi nó. Tôi không hiểu câu hỏi của bạn về tham số cố định - bạn có thể làm rõ câu hỏi không? k
Cyan

Re: câu hỏi của hồng y. Lưu ý rằng ưu tiên là phân phối trên các bản phân phối có hỗ trợ trong . Nếu tôi hỏi câu hỏi của bạn theo nghĩa đen, bạn đang hỏi về một ưu tiên có hỗ trợ về ba biến ngẫu nhiên không đổi , đó là chuyện nhỏ để phân tích. Nhưng vì bạn đã viết trong một nhận xét khác "Nếu phạm vi là thì bất kỳ phân phối nào đặt bất kỳ khối lượng nào lên các giá trị không nằm trong cho phân phối có vẻ ngớ ngẩn," Tôi nghĩ bạn ' lại yêu cầu phân phối dữ liệu rời rạc. Câu trả lời ngắn gọn là "không, nó không ngớ ngẩn." Tiếp tục ...[0,1]0,10,1,,nSk
Cyan


Tôi nghĩ rằng có một số vấn đề ở đây: (a) Tuyên bố câu hỏi có thể sử dụng một số sàng lọc để làm rõ mục tiêu cuối cùng, (b) câu hỏi, nhận xét và câu trả lời đã bị nhầm lẫn thông qua lỗi chính tả, lỗi tính toán và nhiều luồng hội thoại và (c) các bình luận của tôi được tham chiếu ở trên xuất hiện một chút ngoài ngữ cảnh. Tuyên bố của tôi về (Typo: nên là ) liên quan đến phân phối sau của được đưa ra . Nếu tôi biết thì bất kỳ phân phối sau nào không đặt toàn bộ khối lượng của nó sẽ không thể chấp nhận được. SkSnSnSkSn{Sk,,n}
Đức hồng y

0

Đặt mỗi thuộc họ phân phối và có tham số .XiFθ

Cho, , chúng tôi có một bản phân phối trên :Skθ

Pr(θSk)=1ZPr(θ)Pr(Skθ)

Và, phân phối của chúng tôi trên , là Snnk

Pr(Sn=iSk)=Pr(Snk=iSk|Sk)=Pr(Snk=iSk|θ)Pr(θSk)dθ

(và tương tự cho )n<k

Cả hai phương trình này đều có dạng đẹp khi là phân phối trong họ hàm mũ được đóng dưới tổng các phần tử iid như phân phối chuẩn, phân phối gamma và phân phối nhị thức. Nó cũng hoạt động cho các trường hợp đặc biệt của họ như phân phối theo cấp số nhân và phân phối Bernoulli.F

Có thể thú vị khi coi là họ của các phân phối nhị thức tỷ lệ (bởi ) với các "thử nghiệm" và đưa giới hạn khi đi đến vô cùng.1F nn1nnn

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.