Vấn đề chính với mạng lưới thần kinh có xu hướng ngăn chặn sự phù hợp quá mức. Chính quy hóa Bayes (hạn chế độ lớn của các trọng số) là một cách tiếp cận này, ổn định cấu trúc (nghĩa là hạn chế số lượng nút ẩn và / hoặc trọng số là một cách khác). Cả hai cách tiếp cận đều không phải là thuốc chữa bách bệnh, và nói chung, sự kết hợp giữa chính quy hóa và ổn định cấu trúc là tốt hơn (có nghĩa là bạn cần xác thực lại một lần nữa để chọn kiến trúc mạng - sử dụng bằng chứng Bayes cho điều này là một ý tưởng tồi vì kết quả là sai lệch về việc sử dụng nó trong việc điều chỉnh các tham số chính quy và không đáng tin cậy nếu có bất kỳ đặc tả sai nào của mô hình). Cái nào hoạt động tốt nhất về cơ bản là phụ thuộc vào vấn đề và cách tốt nhất để tìm hiểu là thử cả hai và xem (sử dụng xác thực chéo để ước tính hiệu suất theo cách không thiên vị).
Ngoài ra, chính quy hóa không phải là Bayes, bạn có thể chọn mức độ thường xuyên hóa mạng bằng cách sử dụng xác thực chéo thay thế. Một trong những vấn đề với các phương thức Bayes là chúng có thể cho kết quả xấu nếu mô hình bị chỉ định sai, trong trường hợp đó các phương thức chính quy hóa dựa trên xác thực chéo có thể mạnh hơn.
Một điểm quan trọng khác là không phải tất cả các công thức mạng thần kinh Bayes đều giống nhau. Khung bằng chứng của MacKay có xu hướng không hoạt động tốt đối với các vấn đề phân loại vì phép tính gần đúng Laplace mà nó sử dụng không hoạt động tốt cho các phân phối sau bị lệch cho các trọng số. Cách tiếp cận MCMC của Radford Neal có khả năng hoạt động tốt hơn cho các nhiệm vụ này, nhưng tốn kém về mặt tính toán và đánh giá sự hội tụ, v.v. không đơn giản như vậy.
Tuy nhiên, các mô hình mạng nơ-ron khá khó để thực hiện đúng và trong thực tế sẽ dễ dàng có được hiệu suất khái quát hóa tốt từ các phương thức kernel hoặc các quy trình Gaussian, vì vậy tôi sẽ sử dụng chúng thay thế cho hầu hết các nhiệm vụ, đặc biệt là nếu có ít dữ liệu đào tạo.
Gần đây tôi đã thực hiện một nghiên cứu thực nghiệm sâu rộng về vấn đề này, nhưng tôi cần tìm một tạp chí chấp nhận các nghiên cứu thực nghiệm về sự quan tâm của các học viên, nhưng với rất ít nội dung nghiên cứu mới.