Tôi hiện đang đọc cuốn sách "Làm phân tích dữ liệu Bayesian" tuyệt vời của Kruschke. Tuy nhiên, chương về hồi quy logistic phân cấp (Chương 20) hơi khó hiểu.
Hình 20.2 mô tả một hồi quy logistic phân cấp trong đó tham số Bernoulli được định nghĩa là hàm tuyến tính trên các hệ số được chuyển đổi thông qua hàm sigmoid. Đây dường như là cách hồi quy logistic phân cấp được đặt ra trong hầu hết các ví dụ tôi đã thấy trong các nguồn khác trên mạng. Ví dụ: http://polisci2.ucsd.edu/cfariss/code/SIMlogit02.orms
Tuy nhiên, khi các yếu tố dự đoán là danh nghĩa, anh ta thêm một lớp trong hệ thống phân cấp - tham số Bernoulli hiện được rút ra từ phân phối beta (Hình 20.5) với các tham số được xác định bởi mu và kappa, trong đó mu là biến đổi sigmoid của hàm tuyến tính của các hệ số và kappa sử dụng gamma trước.
Điều này có vẻ hợp lý và tương tự như ví dụ lật đồng xu từ chương 9, nhưng tôi không thấy những gì có dự đoán danh nghĩa phải làm với việc thêm phân phối beta. Tại sao người ta không làm điều này trong trường hợp các yếu tố dự đoán số liệu và tại sao phân phối beta được thêm vào cho các yếu tố dự đoán danh nghĩa?
EDIT: Làm rõ về các mô hình tôi đang đề cập đến. Đầu tiên, một mô hình hồi quy logistic với các yếu tố dự đoán số liệu (không có beta trước). Điều này tương tự với các ví dụ khác về hồi quy logistic phân cấp, chẳng hạn như ví dụ lỗi ở trên:
Sau đó, ví dụ với các dự đoán danh nghĩa. Đây là nơi tôi không hiểu rõ vai trò của mức "thấp hơn" của hệ thống phân cấp (kết hợp kết quả logistic vào bản beta trước cho nhị thức) và tại sao nó phải khác với ví dụ số liệu.