Đưa ra một mô hình phân cấp , tôi muốn một quy trình hai giai đoạn để phù hợp với mô hình. Đầu tiên, sửa một số siêu đường kính và sau đó thực hiện suy luận Bayes trên phần còn lại của các tham số . Để sửa chữa các siêu đường kính, tôi đang xem xét hai lựa chọn.θ φ
- Sử dụng Empirical Bayes (EB) và tối đa hóa khả năng cận biên (tích hợp phần còn lại của mô hình có chứa các tham số chiều cao).
- Sử dụng các kỹ thuật Xác thực chéo (CV) như xác thực chéo để chọn tối đa hóa khả năng .θ p ( dữ liệu thử nghiệm | dữ liệu đào tạo , θ )
Ưu điểm của EB là tôi có thể sử dụng tất cả dữ liệu cùng một lúc, trong khi đối với CV tôi cần (có khả năng) tính toán khả năng của mô hình nhiều lần và tìm kiếm . Hiệu suất của EB và CV tương đương nhau trong nhiều trường hợp (*) và thường thì EB sẽ nhanh hơn để ước tính.
Câu hỏi: Có một nền tảng lý thuyết nào liên kết cả hai (giả sử EB và CV giống nhau trong giới hạn của dữ liệu lớn) không? Hoặc liên kết EB với một số tiêu chí chung chung như rủi ro thực nghiệm? Ai đó có thể chỉ ra một tài liệu tham khảo tốt?
(*) Như một minh họa, đây là một số liệu từ Murphy Machine Learning , Phần 7.6.4, trong đó ông nói rằng đối với hồi quy sườn, cả hai quy trình đều cho kết quả rất giống nhau:
Murphy cũng nói rằng lợi thế thực tế chính của Bayes theo kinh nghiệm (ông gọi đó là "thủ tục bằng chứng") so với CV là khi bao gồm nhiều siêu tham số (ví dụ: hình phạt riêng cho từng tính năng, như xác định mức độ phù hợp tự động hoặc ARD). Ở đó không thể sử dụng CV.