Mô hình Bayes phân cấp tỷ lệ mới mắc


8

Cuốn sách của Kevin Murphy nói về một vấn đề Bayesian phân cấp cổ điển (ban đầu được thảo luận trong Johnson and Albert, 1999, p24):

Giả sử rằng chúng tôi đang cố gắng ước tính tỷ lệ ung thư ở thành phố. Ở mỗi thành phố, chúng tôi lấy mẫu một số cá nhân N i và đo số người mắc bệnh ung thư x iBin ( N i , θ i ) , trong đó θ i là tỷ lệ ung thư thực sự trong thành phố.NNixiBin(Ni,θi)θi

Chúng tôi muốn ước lượng 's trong khi cho phép các thành phố dữ liệu nghèo mượn sức mạnh thống kê từ các thành phố dữ liệu phong phú.θi

Để làm như vậy, anh ta lập mô hình để tất cả các thành phố chia sẻ cùng một trước, vì vậy các mô hình cuối cùng trông như sau:θiBeta(a,b)

p(D,θ,η|N)=p(η)i=1NBin(xi|Ni,θi)Beta(θi|η)

trong đó .η=(a,b)

Tất nhiên, phần cốt yếu của mô hình này là (tôi trích dẫn), "rằng chúng ta suy ra từ dữ liệu, vì nếu chúng ta chỉ kẹp nó vào một hằng số, θ i sẽ độc lập có điều kiện, và sẽ có không có luồng thông tin giữa chúng ".η=(a,b)θi


Tôi đang cố gắng mô hình hóa điều này trong PyMC , nhưng theo tôi hiểu, tôi cần một ưu tiên cho b (tôi tin rằng đây là p ( η ) ở trên). Điều gì sẽ là một tốt trước cho mô hình này?abp(η)

Trong trường hợp nó giúp, mã, như tôi có bây giờ là:

bins = dict()
ps   = dict()
for i in range(N_cities):
    ps[i]   = pm.Beta("p_{}".format(i), alpha=a, beta=b)
    bins[i] = pm.Binomial('bin_{}'.format(i), p=ps[i],n=N_trials[i],  value=N_yes[i], observed=True)

mcmc = pm.MCMC([bins, ps])

nơi tôi tin rằng tôi cần một ưu tiên cho ab. Làm thế nào tôi nên chọn một?

Câu trả lời:


9

p(a,b)(a+b)5/2a+ba+b grows, the variance of the beta distribution shrinks; in this case, smaller prior variance constrains the "weight" of the observed data in the posterior.) Additionally, this prior does not set whether a>b, or the opposite, so appropriate distributions of pairs of (a,b) are inferred from all the data together, as you would prefer in this problem.

θ(a,b)logit(aa+b)log(a+b)


1
Cảm ơn @ user777. Thật không may, hiện tại tôi không thể sử dụng các linh mục đa biến, vì vậy tôi đã để lại một câu hỏi tiếp theo ở đây
Amelio Vazquez-Reina
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.