Xấp xỉ bậc hai của hàm mất (Sách học sâu, 7.33)


11

Trong cuốn sách của Goodfellow (2016) về học tập sâu, ông đã nói về sự tương đương của việc dừng sớm với chính quy L2 ( https://www.deeplearningbook.org/contents/THERization.html trang 247).

Xấp xỉ bậc hai của hàm chi phí j được cho bởi:

J^(θ)=J(w)+12(ww)TH(ww)

H

f(w+ϵ)=f(w)+f(w)ϵ+12f(w)ϵ2

Câu trả lời:


15

Họ nói về trọng lượng tối ưu:

Chúng ta có thể mô hình hàm chi phí với một xấp xỉ bậc hai trong vùng lân cận giá trị tối ưu theo kinh nghiệm của các trọng sốJw

Tại thời điểm đó, công cụ phái sinh đầu tiên là zero, do đó, trung hạn sẽ bị loại bỏ.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.