Hồi quy logistic có thể được mô tả như một sự kết hợp tuyến tính
η=β0+β1X1+...+βkXk
được truyền qua chức năng liên kết :g
g(E(Y))=η
trong đó chức năng liên kết là chức năng logit
E(Y|X,β)=p=logit−1(η)
Trong đó chỉ lấy các giá trị trong và các hàm logit nghịch đảo biến đổi tổ hợp tuyến tính thành phạm vi này. Đây là nơi hồi quy logistic cổ điển kết thúc.{ 0 , 1 } ηY{0,1}η
Tuy nhiên, nếu bạn nhớ rằng cho các biến chỉ lấy các giá trị trong , thì có thể coi là . Trong trường hợp này, đầu ra của hàm logit có thể được coi là xác suất có điều kiện của "thành công", tức là . Phân phối Bernoulli là phân phối mô tả xác suất quan sát kết quả nhị phân, với một số tham số , vì vậy chúng ta có thể mô tả là{ 0 , 1 } E ( Y | X , β ) P ( Y = 1 | X , β ) P ( Y = 1 | X , β ) p YE(Y)=P(Y=1){0,1}E(Y|X,β)P(Y=1|X,β)P(Y=1|X,β)pY
yi∼Bernoulli(p)
Vì vậy, với hồi quy logistic, chúng tôi tìm kiếm một số tham số mà togeder với các biến độc lập tạo thành một tổ hợp tuyến tính . Trong hồi quy cổ điển (chúng tôi giả sử hàm liên kết là hàm nhận dạng), tuy nhiên để mô hình lấy các giá trị trong chúng ta cần chuyển đổi sao cho phù hợp trong phạm vi .X η E ( Y | X , β ) = η Y { 0 , 1 } η [ 0 , 1 ]βXηE(Y|X,β)=ηY{0,1}η[0,1]
Bây giờ, để ước tính hồi quy logistic theo cách Bayes, bạn chọn một số giá trị cho các tham số như với hồi quy tuyến tính (xem Kruschke et al, 2012 ), sau đó sử dụng hàm logit để chuyển đổi tổ hợp tuyến tính , do đó, sử dụng đầu ra của nó làm tham số của phân phối Bernoulli mô tả biến của bạn . Vì vậy, vâng, bạn thực sự sử dụng phương trình và hàm liên kết logit giống như trong trường hợp thường xuyên, và phần còn lại hoạt động (ví dụ chọn các mục sư) như với ước tính hồi quy tuyến tính theo cách Bayesian. η p YβiηpY
Cách tiếp cận đơn giản để chọn các mục sư là chọn các bản phân phối Bình thường (nhưng bạn cũng có thể sử dụng các bản phân phối khác, ví dụ: phân phối - hoặc Laplace cho mô hình mạnh hơn) cho với các tham số và được đặt trước hoặc lấy từ các linh mục phân cấp . Bây giờ, có định nghĩa mô hình, bạn có thể sử dụng phần mềm như JAGS để thực hiện mô phỏng Markov Chain Monte Carlo để bạn ước tính mô hình. Dưới đây tôi đăng mã JAGS cho mô hình logistic đơn giản (kiểm tra ở đây để biết thêm ví dụ).β i μ i σ 2 itβiμiσ2i
model {
# setting up priors
a ~ dnorm(0, .0001)
b ~ dnorm(0, .0001)
for (i in 1:N) {
# passing the linear combination through logit function
logit(p[i]) <- a + b * x[i]
# likelihood function
y[i] ~ dbern(p[i])
}
}
Như bạn có thể thấy, mã trực tiếp chuyển thành định nghĩa mô hình. Phần mềm làm gì là nó rút ra một số giá trị từ các mục sư bình thường a
và b
sau đó nó sử dụng các giá trị đó để ước tính p
và cuối cùng, sử dụng hàm khả năng để đánh giá khả năng dữ liệu của bạn được cung cấp cho các tham số đó (đây là khi bạn sử dụng định lý Bayes, xem tại đây để biết mô tả chi tiết hơn).
Mô hình hồi quy logistic cơ bản có thể được mở rộng để mô hình hóa sự phụ thuộc giữa các dự đoán sử dụng mô hình phân cấp (bao gồm hyperpriors ). Trong trường hợp này, bạn có thể rút từ phân phối Bình thường nhiều biến cho phép chúng tôi đưa thông tin về hiệp phương sai giữa các biến độc lậpβiΣ
⎛⎝⎜⎜⎜⎜β0β1⋮βk⎞⎠⎟⎟⎟⎟∼MVN⎛⎝⎜⎜⎜⎜⎜⎡⎣⎢⎢⎢⎢μ0μ1⋮μk⎤⎦⎥⎥⎥⎥,⎡⎣⎢⎢⎢⎢⎢σ20σ1,0⋮σk,0σ0,1σ21⋮σk,1……⋱…σ0,kσ1,k⋮σ2k⎤⎦⎥⎥⎥⎥⎥⎞⎠⎟⎟⎟⎟⎟
... nhưng điều này sẽ đi vào chi tiết, vì vậy hãy dừng lại ở đây.
Phần "Bayes" ở đây là chọn các linh mục, sử dụng định lý Bayes và mô hình xác định theo thuật ngữ xác suất. Xem ở đây để định nghĩa về "mô hình Bayes" và ở đây để biết một số trực giác chung về phương pháp tiếp cận Bayes . Điều bạn cũng có thể nhận thấy là việc xác định các mô hình khá đơn giản và linh hoạt với phương pháp này.
Kruschke, JK, Aguinis, H., & Joo, H. (2012). Đã đến lúc: phương pháp Bayes để phân tích dữ liệu trong khoa học tổ chức. Phương pháp nghiên cứu tổ chức, 15 (4), 722-752.
Gelman, A., Jakulin, A., Pittau, GM và Su, Y.-S. (2008). Một phân phối trước mặc định thông tin yếu cho các mô hình hồi quy và hậu cần khác. Biên niên sử thống kê ứng dụng, 2 (4), 1360 Từ1383.