Tại sao sử dụng phân phối beta trên tham số Bernoulli cho hồi quy logistic phân cấp?


13

Tôi hiện đang đọc cuốn sách "Làm phân tích dữ liệu Bayesian" tuyệt vời của Kruschke. Tuy nhiên, chương về hồi quy logistic phân cấp (Chương 20) hơi khó hiểu.

Hình 20.2 mô tả một hồi quy logistic phân cấp trong đó tham số Bernoulli được định nghĩa là hàm tuyến tính trên các hệ số được chuyển đổi thông qua hàm sigmoid. Đây dường như là cách hồi quy logistic phân cấp được đặt ra trong hầu hết các ví dụ tôi đã thấy trong các nguồn khác trên mạng. Ví dụ: http://polisci2.ucsd.edu/cfariss/code/SIMlogit02.orms

Tuy nhiên, khi các yếu tố dự đoán là danh nghĩa, anh ta thêm một lớp trong hệ thống phân cấp - tham số Bernoulli hiện được rút ra từ phân phối beta (Hình 20.5) với các tham số được xác định bởi mu và kappa, trong đó mu là biến đổi sigmoid của hàm tuyến tính của các hệ số và kappa sử dụng gamma trước.

Điều này có vẻ hợp lý và tương tự như ví dụ lật đồng xu từ chương 9, nhưng tôi không thấy những gì có dự đoán danh nghĩa phải làm với việc thêm phân phối beta. Tại sao người ta không làm điều này trong trường hợp các yếu tố dự đoán số liệu và tại sao phân phối beta được thêm vào cho các yếu tố dự đoán danh nghĩa?

EDIT: Làm rõ về các mô hình tôi đang đề cập đến. Đầu tiên, một mô hình hồi quy logistic với các yếu tố dự đoán số liệu (không có beta trước). Điều này tương tự với các ví dụ khác về hồi quy logistic phân cấp, chẳng hạn như ví dụ lỗi ở trên:

yiBernoulli(μi)μi=sig(β0+jβjxji)β0N(M0,T0)βjN(Mβ,Tβ)

Sau đó, ví dụ với các dự đoán danh nghĩa. Đây là nơi tôi không hiểu rõ vai trò của mức "thấp hơn" của hệ thống phân cấp (kết hợp kết quả logistic vào bản beta trước cho nhị thức) và tại sao nó phải khác với ví dụ số liệu.

ziBin(θi,N)θiBeta(aj,bj)aj=μjκbj=(1μj)κκΓ(Sκ,Rκ)μj=sig(β0+jβjxji)β0N(M0,T0)βjN(0,τβ)τβ=1/σβ2σβ2folded t(Tt,DF)

Câu trả lời:


9

Hai mô hình bạn so sánh có nhiều tính năng không liên quan và tôi nghĩ bạn có thể đặt lại câu hỏi của mình rõ ràng hơn trong ngữ cảnh của hai mô hình đơn giản sau:

Mô hình 1:

yi|μiBern(μi)μiπ(μi)

Mô hình 2:

yi|θiBern(θi)θi|μi,κBeta(μiκ,(1μi)κ)μiπ(μi)

Câu hỏi của bạn là: (1) vai trò của phân phối beta; và có liên quan, (2) làm thế nào (nếu có) là Mô hình 2 khác với Mô hình 1?

Nhìn bề ngoài, chúng có vẻ là những mô hình khá khác nhau, nhưng trên thực tế, các phân phối biên của trong cả hai mô hình là giống hệt nhau. Phân phối sau của trong Mô hình 1 là trong khi phân phối hậu biên của trong Mô hình 2 là: μiμi

p(μi|yi)μiyi(1μi)1yiπ(μi)
μi
p(μi|yi,κ)01θiyi+μiκ1(1θi)κ(1μi)yiB(κμi,κ(1μi))dθπ(μi)B(yi+μiκ,1yi+κ(1μi))π(μi)B(κμi,κ(1μi))μiyi(1μi)1yiπ(μi)

Do đó, bất kỳ lợi thế nào có được từ việc sử dụng Mô hình 2 là tính toán. Việc định lượng quá mức các mô hình phân cấp, chẳng hạn như bổ sung trong Mô hình 2, đôi khi có thể cải thiện hiệu quả của quy trình lấy mẫu; ví dụ: bằng cách giới thiệu các mối quan hệ liên hợp có điều kiện giữa các nhóm tham số (xem câu trả lời của Jack Tanner) hoặc bằng cách phá vỡ mối tương quan giữa các tham số quan tâm (google "Mở rộng tham số").θi


5

Lý do để vẽ tham số Bernoulli từ bản phân phối beta là bản beta được liên hợp với nhị thức. Sử dụng phân phối trước liên hợp cho phép giải pháp dạng đóng để tìm ra hậu thế.

EDIT: làm rõ. Hoặc là mô hình sẽ làm việc. Ngay cả với MCMC, thật hữu ích khi có các linh mục liên hợp vì điều đó cho phép sử dụng các bộ lấy mẫu chuyên dụng cho các loại phân phối khác nhau hiệu quả hơn so với các bộ lấy mẫu chung. Ví dụ: xem hướng dẫn sử dụng JAGS giây. 4.1.1 và giây 4.2.


Có thể không có đủ ngữ cảnh từ cuốn sách trong câu hỏi của tôi, nhưng những phân tích này được thực hiện với lấy mẫu Gibbs, do đó, việc thể hiện dạng đóng của hậu thế là không cần thiết. Trong ví dụ tôi đã liên kết, tham số bernoulli không cố định dưới dạng phân phối beta, nhưng phát sinh từ sự biến đổi sigmoid của các yếu tố dự đoán tuyến tính, có hệ số phân phối bình thường. Đây cũng là cách Kruschke trình bày một ví dụ trước đó (với các yếu tố dự đoán số liệu) trong chương này (tham số bernoulli chỉ là phép biến đổi sigmoid của hàm tuyến tính với các hệ số phân phối bình thường)
user4733

@ user4733 Jack Tanner nói đúng về việc beta là liên hợp trước các mẫu bernoulli. có vẻ như nhiều hơn một sự trùng hợp ngẫu nhiên mà nó đã được chọn. Có, bạn có thể thực hiện lấy mẫu Gibbs để có phân phối sau nhưng trong mô hình phân cấp có nhiều hơn một liên quan trước đó và có thể là bạn đang đặt trước một siêu tham số (một tham số cho một họ các phân phối trước. trước ưu tiên nếu bạn muốn. Trong bối cảnh đó, có thể thuận tiện khi sử dụng liên hợp trước. Một số mô tả của bạn về cuốn sách gây nhầm lẫn cho chúng tôi.
Michael R. Chernick

1
Bạn đang thực hiện những trích đoạn nhỏ tạo ra những khoảng trống trong khả năng của chúng tôi để hiểu những gì đang diễn ra. Bạn cần mô tả mô hình và hệ thống phân cấp của các linh mục tốt hơn để chúng tôi giúp đỡ (ít nhất là cho tôi)>
Michael R. Chernick

Đã thêm một số mô tả cho các mô hình phân cấp mà tôi đang đề cập. Hy vọng nó sẽ giúp.
dùng4733
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.