Tôi muốn minh họa một ví dụ như mô hình hóa liên quan đến tỷ lệ ung thư (Như trong Johnson và Albert 1999). Nó sẽ chạm vào yếu tố đầu tiên và thứ ba mà bạn quan tâm.
Vì vậy, vấn đề là dự đoán tỷ lệ ung thư ở các thành phố khác nhau. Giả sử chúng tôi có dữ liệu về số người ở các thành phố khác nhau và số người chết vì ung thư . Nói rằng chúng tôi muốn ước tính tỷ lệ ung thư . Có nhiều cách khác nhau để mô hình hóa chúng và như chúng ta thấy có vấn đề với từng trong số chúng. Chúng ta sẽ thấy mô hình vịnh gia truyền có thể khắc phục một số vấn đề.
1. Một cách là ước tính riêng biệt nhưng chúng ta sẽ gặp phải vấn đề dữ liệu thưa thớt và sẽ bị đánh giá thấp về tỷ lệ như đối với thấp .Nixiθi
Ni
2. Một cách tiếp cận khác để quản lý vấn đề dữ liệu thưa thớt sẽ là sử dụng cùng cho tất cả các thành phố và buộc các tham số nhưng đây cũng là một giả định rất mạnh.
3. Vì vậy, những gì có thể được thực hiện là tất cả các đều giống nhau theo một cách nào đó nhưng cũng với các biến thể cụ thể của thành phố. Vì vậy, người ta có thể mô hình hóa theo cách mà tất cả các được rút ra từ một phân phối chung. Giả sử và
Một phân phối chung đầy đủ sẽ là trong đó . Chúng ta cần suy raθi
θiθixi∼Bin(Ni,θi)θi∼Beta(a,b)
p(D,θ,η|N)=p(η)∏Ni=1Bin(xi|Ni,θi)Beta(θi|η)η=(a,b)ηtừ dữ liệu. Nếu nó được kẹp vào một hằng số thì thông tin sẽ không chảy giữa và chúng sẽ độc lập có điều kiện. Nhưng bằng cách coi là ẩn số, chúng tôi cho phép các thành phố có ít dữ liệu mượn sức mạnh thống kê từ các thành phố có nhiều dữ liệu hơn.
Ý tưởng chính là để nhiều người Bayes hơn và đặt các linh mục lên các linh mục để mô hình sự không chắc chắn trong siêu đường kính. Điều này cho phép luồng ảnh hưởng giữa các trong ví dụ này.θiη
θi