Xác thực chéo so với Bayes theo kinh nghiệm để ước tính siêu đường kính


20

Đưa ra một mô hình phân cấp , tôi muốn một quy trình hai giai đoạn để phù hợp với mô hình. Đầu tiên, sửa một số siêu đường kính và sau đó thực hiện suy luận Bayes trên phần còn lại của các tham số . Để sửa chữa các siêu đường kính, tôi đang xem xét hai lựa chọn.θ φp(x|ϕ,θ)θϕ

  1. Sử dụng Empirical Bayes (EB) và tối đa hóa khả năng cận biên (tích hợp phần còn lại của mô hình có chứa các tham số chiều cao).p(all data|θ)
  2. Sử dụng các kỹ thuật Xác thực chéo (CV) như xác thực chéo để chọn tối đa hóa khả năng .θ p ( dữ liệu thử nghiệm | dữ liệu đào tạo , θ )kθp(dữ liệu kiểm tra|dữ liệu đào tạo,θ)

Ưu điểm của EB là tôi có thể sử dụng tất cả dữ liệu cùng một lúc, trong khi đối với CV tôi cần (có khả năng) tính toán khả năng của mô hình nhiều lần và tìm kiếm . Hiệu suất của EB và CV tương đương nhau trong nhiều trường hợp (*) và thường thì EB sẽ nhanh hơn để ước tính.θ

Câu hỏi: Có một nền tảng lý thuyết nào liên kết cả hai (giả sử EB và CV giống nhau trong giới hạn của dữ liệu lớn) không? Hoặc liên kết EB với một số tiêu chí chung chung như rủi ro thực nghiệm? Ai đó có thể chỉ ra một tài liệu tham khảo tốt?


(*) Như một minh họa, đây là một số liệu từ Murphy Machine Learning , Phần 7.6.4, trong đó ông nói rằng đối với hồi quy sườn, cả hai quy trình đều cho kết quả rất giống nhau:

murphy - vịnh thực nghiệm vs CV

Murphy cũng nói rằng lợi thế thực tế chính của Bayes theo kinh nghiệm (ông gọi đó là "thủ tục bằng chứng") so với CV là khi bao gồm nhiều siêu tham số (ví dụ: hình phạt riêng cho từng tính năng, như xác định mức độ phù hợp tự động hoặc ARD). Ở đó không thể sử dụng CV.θ


Bạn có thể mô tả chi tiết hơn những gì bạn đang làm cho phương pháp xác thực chéo không? Bạn đang sửa chữa và sau đó sử dụng các dữ liệu huấn luyện để ước lượng các thông số khác trước khi xác nhận? θ
Neil G

@NeilG tối đa hóa tổng khả năng dữ liệu dự đoán cận biên của nhật ký trên các bộ xác thực chéo (k được tích hợp).
Ghi nhớ

1
Nếu được tích hợp cả hai lần, thì sự khác biệt giữa CV và EB là gì? k
Neil G

2
Câu hỏi tuyệt vời. Tôi lấy tự do để thêm một con số từ sách giáo khoa của Murphy vào câu hỏi của bạn để minh họa quan điểm của bạn về hai thủ tục thường có thể so sánh được. Tôi hy vọng bạn sẽ không quan tâm đến sự bổ sung này.
amip nói phục hồi Monica

Câu trả lời:


15

Tôi nghi ngờ sẽ có một liên kết lý thuyết nói rằng tối đa hóa CV và bằng chứng là tương đương về mặt triệu chứng vì bằng chứng cho chúng ta biết xác suất của dữ liệu đưa ra các giả định của mô hình . Do đó, nếu mô hình được chỉ định sai, thì bằng chứng có thể không đáng tin cậy. Mặt khác, xác thực chéo đưa ra ước tính xác suất của dữ liệu, cho dù các giả định mô hình hóa có chính xác hay không. Điều này có nghĩa là bằng chứng có thể là một hướng dẫn tốt hơn nếu các giả định mô hình là chính xác khi sử dụng ít dữ liệu hơn, nhưng xác thực chéo sẽ mạnh mẽ chống lại đặc tả sai của mô hình. CV là không thiên vị, nhưng tôi cho rằng bằng chứng không trừ khi các giả định mô hình xảy ra là chính xác.

Đây thực chất là trực giác / kinh nghiệm của tôi; Tôi cũng sẽ được quan tâm để nghe về nghiên cứu về điều này.

Lưu ý rằng đối với nhiều mô hình (ví dụ hồi quy sườn, quy trình Gaussian, hồi quy sườn hạt nhân / LS-SVM, v.v.) xác thực chéo một lần có thể được thực hiện ít nhất là hiệu quả như ước tính bằng chứng, do đó không nhất thiết phải tính toán lợi thế đấy.

Phụ lục: Cả khả năng biên xác suất và ước tính hiệu suất chéo được đánh giá qua một mẫu dữ liệu hữu hạn và do đó luôn có khả năng phù hợp quá mức nếu một mô hình được điều chỉnh bằng cách tối ưu hóa một trong hai tiêu chí. Đối với các mẫu nhỏ, sự khác biệt về phương sai của hai tiêu chí có thể quyết định loại nào hoạt động tốt nhất. Xem giấy của tôi

Gavin C. Cawley, Nicola LC Talbot, "Về sự phù hợp quá mức trong lựa chọn mô hình và xu hướng lựa chọn tiếp theo trong đánh giá hiệu suất", Tạp chí nghiên cứu máy học, 11 (tháng 7): 2079−2107, 2010 ( pdf )


Tại sao bạn nói rằng CV mạnh mẽ chống lại một mô hình xác định sai? Trong trường hợp của anh ta, không có sự bảo vệ nào như vậy vì việc xác thực chéo đang tìm kiếm trên cùng một không gian mà EB đang tính toán khả năng. Nếu các giả định mô hình của anh ta sai, thì xác thực chéo sẽ không cứu anh ta.
Neil G

1
φφθ

ps Tôi đã thực hiện một phân tích về việc tránh quá mức trong các mạng thần kinh với chính quy hóa Bayes trong đó các tham số chính quy được điều chỉnh thông qua tối đa hóa khả năng cận biên. Có những tình huống mà điều này hoạt động rất tệ (tệ hơn là không có bất kỳ sự chính quy nào cả). Đây dường như là một vấn đề của mô hình đặc tả sai.
Dikran Marsupial

Anh ta có thể nhận được cùng một "chỉ số về hiệu suất tổng quát hóa" bằng cách kiểm tra tổng xác suất log của dữ liệu được cung cấp phân phối ước tính được trả về bởi EB (sẽ bằng với entropy của phân phối đó). Không có cách nào để đánh bại nó trong trường hợp này bởi vì nó là giải pháp phân tích cho vấn đề này. Tôi không thấy lý do tại sao xác thực chéo sẽ có ý nghĩa khi bạn có thể tính toán khả năng cho EB.
Neil G

2
@probabilityislogic, tôi không chắc chắn những gì bạn đang nhận được (vấn đề chắc chắn là ở cuối của tôi !; o). Tôi có thể nói với bạn từ kinh nghiệm thực tế mặc dù vấn đề đó rất thực tế. Tôi đã làm việc với các vấn đề trong việc lựa chọn mô hình trong vài năm và tôi đã gặp nhiều vấn đề trong đó tối đa hóa khả năng cận biên hóa ra là một ý tưởng rất tồi. Xác thực chéo cũng thực hiện tốt đối với hầu hết các bộ dữ liệu, nhưng khi nó hoạt động kém thì hiếm khi thực hiện một cách thảm khốc như tối đa hóa bằng chứng đôi khi.
Dikran Marsupial

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.