Stan


16

Tôi đã xem qua tài liệu Stan có thể tải về từ đây . Tôi đặc biệt quan tâm đến việc họ thực hiện chẩn đoán Gelman-Rubin. Bài báo gốc Gelman & Rubin (1992) xác định hệ số giảm quy mô tiềm năng (PSRF) như sau:

Hãy Xi,1,,Xi,N là th chuỗi Markov lấy mẫu, và để có được tổng thể chuỗi độc lập lấy mẫu. Đặt là giá trị trung bình từ chuỗi thứ và là trung bình tổng thể. Xác định, trong đó Và xác địnhM ˉ X i i ˉ X W = 1iMX¯iiX¯s 2 m =1

W=1Mm=1Msm2,
B B = N
sm2=1N1t=1N(X¯mtX¯m)2.
B
B=NM1m=1M(X¯mX¯)2.

Xác định PSRF được ước tính với trong đó trong đó df = 2 \ hat {V} / Var (\ hat {V}) .

V^=(N1N)W+(M+1MN)B.
R= VR^
R^=V^Wdf+3df+1,
df=2V^/Var(V^)

Tài liệu Stan ở trang 349 bỏ qua thuật ngữ với df và cũng loại bỏ thuật ngữ nhân (M+1)/MĐây là công thức của họ,

Công cụ ước tính phương sai là

var^+(θ|y)=N1NW+1NB.
Cuối cùng, thống kê giảm quy mô tiềm năng được xác định bởi
R^=var^+(θ|y)W.

Từ những gì tôi có thể thấy, họ không cung cấp tài liệu tham khảo cho sự thay đổi công thức này và họ cũng không thảo luận về nó. Thông thường không quá lớn và thường có thể thấp đến mức , vì vậy không nên bỏ qua, ngay cả khi thuật ngữ có thể xấp xỉ bằng 1.2 ( M + 1 ) / M d fM2(M+1)/Mdf

Vậy công thức này đến từ đâu?


EDIT: Tôi đã tìm thấy một câu trả lời một phần cho câu hỏi " công thức này đến từ đâu? ", Trong cuốn sách Phân tích dữ liệu Bayes của Gelman, Carlin, Stern và Rubin (ấn bản thứ hai) có cùng một công thức. Tuy nhiên, cuốn sách không giải thích làm thế nào / tại sao có thể bỏ qua những điều khoản đó?


Vẫn chưa có bài báo nào được công bố và công thức có thể sẽ thay đổi trong vài tháng tới.
Ben Goodrich

@Ben Goodrich Cảm ơn bạn đã bình luận. Bạn có thể nói gì thêm về động lực của việc sử dụng công thức này? Và tại sao chính xác công thức sẽ thay đổi?
Greenparker

1
Công thức phân chia mũ R hiện tại là cách chủ yếu áp dụng cho trường hợp chỉ có một chuỗi. Những thay đổi sắp tới chủ yếu là để đối phó với thực tế là phân phối hậu biên bên dưới có thể không bình thường hoặc có giá trị trung bình và / hoặc phương sai.
Ben Goodrich

1
@Ben Goodrich Vâng, tôi hiểu lý do tại sao STAN không chia Rhat. Nhưng ngay cả trong trường hợp đó , và do đó liên tục ( M + 1 ) / M = 3 / 2 mà không phải là có thể bỏ qua. M=2(M+1)/M=3/2
Greenparker

Câu trả lời:


4

Tôi làm theo các liên kết cụ thể đưa ra cho Gelman & Rubin (1992) và nó có σ = n - 1 như trong các phiên bản sau, mặc dù σ thay thế bằng σ +tại Brooks & Gelman (1998) và với ^ v một r +trong BDA2 (Gelman et al, 2003) và BDA3 (Gelman et al, 2013).

σ^=n1nW+1nB
σ^σ^+var^+

var^+

R^=m+1mσ^+Wn1mn,
R^=σ^+W+σ^+Wmn1mn.
n

Gelman & Rubin (1992) cũng có thuật ngữ với df là df / (df-2). Brooks & Gelman (1998) có một phần mô tả lý do tại sao hiệu chỉnh df này không chính xác và xác định (df + 3) / (df + 1). Đoạn trước Phần 3.1 trong Brooks & Gelman (1998) giải thích tại sao (d + 3) / (d + 1) có thể bị loại bỏ.

σ^+Wmn1mn

R^nm

Thông thường M không quá lớn và thường có thể thấp đến mức 2

R^

Tham khảo thêm:

  • Brooks và Gelman (1998). Tạp chí thống kê tính toán và đồ họa, 7 (4) 434-455.

σ^2R^(σ^2+B/mn)/Wdfterm(m+1)/m
Công viên xanh

Tôi bối rối. Bài viết qua liên kết bạn cung cấp và bài viết từ các trang web của Stat Science chỉ có các trang 457-472. Tôi đã không kiểm tra ngay bây giờ, nhưng nhiều năm trước và năm ngoái khi tôi kiểm tra coda, nó không có phiên bản được đề xuất hiện tại.
Aki Vehtari

Lưu ý rằng tôi đã chỉnh sửa câu trả lời của mình. Gelman & Brooks (1998) có thuật ngữ đó (m + 1) / m rõ ràng hơn và có vẻ như bạn đã bỏ lỡ thuật ngữ cuối cùng mà chủ yếu hủy bỏ ảnh hưởng của (m + 1) / m cho việc ra quyết định. Xem đoạn đó trước phần 3.1.
Aki Vehtari

Xin lỗi về điều đó, đó là một lỗi đánh máy. Đó là trang 465, và Gelman và Rubin có định nghĩa chính xác giống như Brooks và Gelman (mà bạn nêu ở trên). Công thức 1.1 trong Brooks và Gelman chính xác là những gì tôi đã viết ra (khi bạn sắp xếp lại một số thuật ngữ).
xanh

"Chúng ta có thể thấy rằng ảnh hưởng của nhiệm kỳ thứ hai và thứ ba là không đáng kể đối với việc ra quyết định khi n lớn", vậy điều bạn đang nói là biểu thức trong BDA và do đó STAN xuất phát từ việc bỏ qua các thuật ngữ này cho n lớn?
xanh
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.