Sự tương đồng tốt để minh họa những điểm mạnh của Mô hình Bayes phân cấp là gì?


10

Tôi còn khá mới đối với thống kê bayes và đã sử dụng JAGS gần đây để xây dựng các mô hình bayesian phân cấp trên các bộ dữ liệu khác nhau. Mặc dù tôi rất hài lòng về kết quả (so với các mô hình glm tiêu chuẩn), tôi cần giải thích cho những người không thống kê về sự khác biệt với các mô hình thống kê tiêu chuẩn là gì. Đặc biệt, tôi muốn minh họa tại sao và khi HBM hoạt động tốt hơn các mô hình đơn giản hơn.

Một sự tương tự sẽ hữu ích, đặc biệt là một yếu tố minh họa một số yếu tố chính:

  • nhiều cấp độ không đồng nhất
  • sự cần thiết phải tính toán nhiều hơn để phù hợp với mô hình
  • khả năng trích xuất thêm "tín hiệu" từ cùng một dữ liệu

Lưu ý rằng câu trả lời nên thực sự là một sự tương tự khai sáng cho những người không thống kê, không phải là một ví dụ dễ thực hiện và dễ theo dõi.


4
Vấn đề "tám trường" kinh điển có vẻ như là một ứng cử viên tuyệt vời để giới thiệu HBM. andrewgelman.com/2014/01/21/NH
Sycorax nói Phục hồi lại

2
@ cafe876. Tôi không thấy bản chất Bayes của mô hình cụ thể theo quan điểm của bạn như thế nào. Là câu hỏi của bạn thực sự cụ thể cho mô hình phân cấp Bayes? hoặc đơn giản là để mô hình phân cấp?
peuhp

@peuhp từ kinh nghiệm của tôi, khung bayesian làm cho việc ước tính các mô hình phức tạp hơn nhiều có thể.
nassimhddd

Câu trả lời:


3

Tôi muốn minh họa một ví dụ như mô hình hóa liên quan đến tỷ lệ ung thư (Như trong Johnson và Albert 1999). Nó sẽ chạm vào yếu tố đầu tiên và thứ ba mà bạn quan tâm.
Vì vậy, vấn đề là dự đoán tỷ lệ ung thư ở các thành phố khác nhau. Giả sử chúng tôi có dữ liệu về số người ở các thành phố khác nhau và số người chết vì ung thư . Nói rằng chúng tôi muốn ước tính tỷ lệ ung thư . Có nhiều cách khác nhau để mô hình hóa chúng và như chúng ta thấy có vấn đề với từng trong số chúng. Chúng ta sẽ thấy mô hình vịnh gia truyền có thể khắc phục một số vấn đề. 1. Một cách là ước tính riêng biệt nhưng chúng ta sẽ gặp phải vấn đề dữ liệu thưa thớt và sẽ bị đánh giá thấp về tỷ lệ như đối với thấp .Nixiθi
Ni
2. Một cách tiếp cận khác để quản lý vấn đề dữ liệu thưa thớt sẽ là sử dụng cùng cho tất cả các thành phố và buộc các tham số nhưng đây cũng là một giả định rất mạnh. 3. Vì vậy, những gì có thể được thực hiện là tất cả các đều giống nhau theo một cách nào đó nhưng cũng với các biến thể cụ thể của thành phố. Vì vậy, người ta có thể mô hình hóa theo cách mà tất cả các được rút ra từ một phân phối chung. Giả sử và Một phân phối chung đầy đủ sẽ là trong đó . Chúng ta cần suy raθi
θiθixiBin(Ni,θi)θiBeta(a,b)
p(D,θ,η|N)=p(η)i=1NBin(xi|Ni,θi)Beta(θi|η)η=(a,b)ηtừ dữ liệu. Nếu nó được kẹp vào một hằng số thì thông tin sẽ không chảy giữa và chúng sẽ độc lập có điều kiện. Nhưng bằng cách coi là ẩn số, chúng tôi cho phép các thành phố có ít dữ liệu mượn sức mạnh thống kê từ các thành phố có nhiều dữ liệu hơn. Ý tưởng chính là để nhiều người Bayes hơn và đặt các linh mục lên các linh mục để mô hình sự không chắc chắn trong siêu đường kính. Điều này cho phép luồng ảnh hưởng giữa các trong ví dụ này.θiη
θi


Cảm ơn, đây là một ví dụ thực sự tốt, tuy nhiên nó không phải là một sự tương tự. Tôi thực sự đang tìm kiếm một cái gì đó tôi có thể giải thích cho một người không thống kê.
nassimhddd

Tôi đoán việc chia sẻ và biến thể ở các cấp độ khác nhau có thể được sử dụng cho những người không thống kê.
dksahuji

Điều đó đúng, nhưng không có câu chuyện nào đơn giản hơn để minh họa điều này?
nassimhddd

3

Khi bạn bị bệnh, bạn quan sát các triệu chứng nhưng điều bạn muốn là chẩn đoán. Nếu bạn không phải là bác sĩ, tôi đoán rằng bạn chỉ cần tìm ra chẩn đoán phù hợp nhất với các triệu chứng của bạn. Nhưng những gì Ph HBM sẽ làm là xem xét các triệu chứng của bạn, ý nghĩa tương đối của chúng, cách chúng phù hợp / liên quan đến các vấn đề sức khỏe khác nhau của bạn, một trong những gia đình của bạn, các bệnh phổ biến hiện tại và điều kiện môi trường, điểm yếu, sức mạnh của bạn ... và sau đó anh ta sẽ kết hợp những thứ này bằng kiến ​​thức của nó để cập nhật những gì anh ta đoán về tình trạng sức khỏe của bạn và sẽ cho bạn chẩn đoán nhiều khả năng hơn.

Tôi chắc chắn rằng sự tương tự này đạt được giới hạn của nó khá sớm nhưng tôi nghĩ rằng nó có thể mang lại một trực giác tốt về những gì người ta mong đợi từ một HBM, phải không? (và tôi đã không tìm thấy một cái tốt hơn)


Tôi thích sự tương tự đó! Có lẽ chỉ cần thêm một chút bằng cách thêm vào đó có thể thêm rằng một số triệu chứng có ý nghĩa hơn đối với các kết luận tiềm năng nhất định (kết quả xét nghiệm máu) so với các kết quả khác (đôi khi bắp chân trái của tôi đau một chút)
MikeP

Một ví dụ tuyệt vời ... nơi tôi nghĩ rằng nó thiếu sót là dường như ngụ ý rằng sức mạnh của HBM nằm ở việc truy cập vào thông tin THÊM (lịch sử, gia đình, v.v.); trong khi tôi muốn bày tỏ rằng HBM phức tạp hơn với thông tin CÙNG. Có cách nào để chuyển thể câu chuyện của bạn không?
nassimhddd

@ cafe876. Thks, hãy để tôi một chút thời gian để suy nghĩ về nó.
peuhp
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.