Độ nhạy của BFGS với các xấp xỉ Hessian ban đầu


9

Tôi đang cố gắng thực hiện phương pháp Broyden-Fletcher-Goldfarb-Shanno để tìm mức tối thiểu của hàm. Tôi cần hai lần đoán ban đầu & và xấp xỉ Ma trận Hessian ban đầu . Các yêu cầu duy nhất tôi tìm thấy cho là nếu Hessian xác định dương đối xứng, thì cũng vậy . Nhìn vào wikipedia, tôi thấy rằng một xấp xỉ ban đầu điển hình là (ma trận danh tính). Đây có phải luôn là một ban đầu tốt không? Có bất kỳ lý do tại sao tôi có thể muốn chọn bất cứ điều gì khác ngoài tôi ? Các lựa chọn khác của B, thỏa mãn các thuộc tính ma trận giống nhau, sẽ ảnh hưởng lớn đến sự hội tụ của phương thức? x 0 B 0 B 0 B 0 B 0 = I B 0 Ix1x0B0B0B0B0=IB0Tôi

Câu trả lời:


6

Nếu bạn có một xấp xỉ Hessian hợp lý, tốt hơn là sử dụng nó thay vì tùy ý .B0= =Tôi

Chỉnh sửa: Lý do là nếu bạn bắt đầu gần với giải pháp , tốc độ hội tụ ban đầu là (với bất kỳ ) bước tuyến tính với hệ số hội tụ bước củanếu đây là đối với một số hiệu chỉnh xếp hạng của ma trận danh tính. Vì vậy, cố gắng để làm cho nhỏ này là rất có giá trị. (Điều này tương đương với điều kiện tiên quyết của hệ thống.) Yếu tố hội tụ cải thiện theo thời gian và cuối cùng tiến đến 0 (hội tụ siêu tuyến), nhưng trong nhiều vấn đề thực sự (đặc biệt là các chiều cao), người ta không bao giờ thực hiện đủ các bước lặp để đạt đến chế độ siêu tuyến. Do đó tốc độ ban đầu khá quan trọng. r > 0 r + 1 r + 1 q = B - 1 0 f ( x ) - G < 1 r Gx*r>0r+1r+1q= =B0-1f"(x*)-G<1rG

Một trường hợp quan trọng là khi giải các bài toán bình phương nhỏ nhất phi tuyến (thu nhỏ ), trong đó phép tính xấp xỉ Gauss-Newton của Hessian ban đầu có thể là tính toán mà không cần dẫn xuất thứ hai. Sử dụng nó làm cho phương thức BFGS trở thành bất biến, tức là bất biến dưới các phép biến đổi tuyến tính của giống như phương pháp của Newton, thường rất có lợi.F(x)22B0= =F'(x0)TF'(x0)x

Một trường hợp quan trọng khác là khi bạn giải quyết một chuỗi các vấn đề liên quan. Thông thường, khởi động lại bộ giải với phép tính gần đúng Hessian cuối cùng của bài toán trước làm giảm đáng kể số lần lặp cần thiết.


Nếu hessian được dự kiến ​​là xác định dương đối xứng, bất kỳ ma trận xác định dương đối xứng vẫn sẽ dẫn đến hội tụ, nhưng tốc độ hội tụ dựa trên mức độ giống với Hessian? B0B0
Paul

Cuối cùng, BFGS quên mất ma trận bắt đầu, do đó, hội tụ là luôn có cùng thứ tự. Nhưng điều đó tất nhiên không thú vị bởi vì bạn không bao giờ thực hiện vô số bước. k
Wolfgang Bangerth

@Paul: Xem chỉnh sửa của tôi.
Arnold Neumaier
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.