Nếu bạn có một xấp xỉ Hessian hợp lý, tốt hơn là sử dụng nó thay vì tùy ý .B0= Tôi
Chỉnh sửa: Lý do là nếu bạn bắt đầu gần với giải pháp , tốc độ hội tụ ban đầu là (với bất kỳ ) bước tuyến tính với hệ số hội tụ bước củanếu đây là đối với một số hiệu chỉnh xếp hạng của ma trận danh tính. Vì vậy, cố gắng để làm cho nhỏ này là rất có giá trị. (Điều này tương đương với điều kiện tiên quyết của hệ thống.) Yếu tố hội tụ cải thiện theo thời gian và cuối cùng tiến đến 0 (hội tụ siêu tuyến), nhưng trong nhiều vấn đề thực sự (đặc biệt là các chiều cao), người ta không bao giờ thực hiện đủ các bước lặp để đạt đến chế độ siêu tuyến. Do đó tốc độ ban đầu khá quan trọng. r > 0 r + 1 r + 1 q = ‖ B - 1 0 f ″ ( x ∗ ) - G ‖ < 1 r Gx*r > 0r + 1r + 1q= ∥ B- 10f′ ′( x*) - G ∥< 1rG
Một trường hợp quan trọng là khi giải các bài toán bình phương nhỏ nhất phi tuyến (thu nhỏ ), trong đó phép tính xấp xỉ Gauss-Newton của Hessian ban đầu có thể là tính toán mà không cần dẫn xuất thứ hai. Sử dụng nó làm cho phương thức BFGS trở thành bất biến, tức là bất biến dưới các phép biến đổi tuyến tính của giống như phương pháp của Newton, thường rất có lợi.∥ F( X ) ∥22B0= F'( x0)TF'( x0)x
Một trường hợp quan trọng khác là khi bạn giải quyết một chuỗi các vấn đề liên quan. Thông thường, khởi động lại bộ giải với phép tính gần đúng Hessian cuối cùng của bài toán trước làm giảm đáng kể số lần lặp cần thiết.