Đã có một số câu trả lời giải thích tại sao ma trận xác định dương đối xứng rất quan trọng, vì vậy tôi sẽ đưa ra câu trả lời giải thích tại sao chúng không quan trọng như một số người, kể cả tác giả của một số câu trả lời đó, nghĩ. Để đơn giản, tôi sẽ giới hạn sự tập trung vào các ma trận đối xứng, và tập trung vào Hessian và tối ưu hóa.
Nếu Chúa đã làm cho thế giới lồi lõm, sẽ không có tối ưu hóa lồi, sẽ chỉ có tối ưu hóa. Tương tự, sẽ không có ma trận xác định dương (đối xứng), sẽ chỉ có ma trận (đối xứng). Nhưng đó không phải là trường hợp, vì vậy hãy đối phó với nó.
Nếu một vấn đề lập trình bậc hai là lồi, nó có thể được giải quyết "một cách dễ dàng". Nếu nó không lồi, vẫn có thể tìm thấy tối ưu toàn cục bằng cách sử dụng các phương thức rẽ nhánh và ràng buộc (nhưng có thể mất nhiều thời gian hơn và nhiều bộ nhớ hơn).
Nếu một phương pháp Newton được sử dụng để tối ưu hóa và Hessian tại một số lần lặp là không xác định, thì không cần thiết phải "hoàn thiện" nó thành sự dứt khoát tích cực. Nếu sử dụng tìm kiếm dòng, có thể tìm thấy hướng của độ cong âm và tìm kiếm dòng được thực hiện dọc theo chúng và nếu sử dụng vùng tin cậy, thì có một số vùng tin cậy đủ nhỏ để giải pháp cho vấn đề vùng tin cậy đạt được giảm dần.
Đối với các phương pháp Quasi-Newton, BFGS (nản chí nếu vấn đề bị hạn chế) và DFP duy trì tính dứt khoát tích cực của xấp xỉ Hessian hoặc nghịch đảo Hessian. Các phương pháp Quasi-Newton khác, chẳng hạn như SR1 (Symmetric Rank One) không nhất thiết phải duy trì độ chính xác dương. Trước khi bạn hoàn toàn bất ngờ về điều đó, đó là một lý do chính đáng để chọn SR1 cho nhiều vấn đề - nếu Hessian thực sự không tích cực xác định dọc theo con đường đến mức tối ưu, sau đó buộc xấp xỉ Quasi-Newton phải là xác định dương có thể dẫn đến một xấp xỉ bậc hai tệ hại cho hàm mục tiêu. Ngược lại, phương pháp cập nhật SR1 "lỏng lẻo như một con ngỗng" và có thể biến đổi một cách rõ ràng sự dứt khoát của nó khi nó diễn ra.
Đối với các vấn đề tối ưu hóa bị ràng buộc phi tuyến, điều thực sự quan trọng không phải là Hessian của hàm mục tiêu, mà là Hessian của Lagrangian. Hessian của Lagrangian có thể là vô hạn ngay cả ở mức tối ưu (và), và thực tế, đó chỉ là phép chiếu của Hessian của Lagrangian vào không gian trống của Jacobian của các ràng buộc hoạt động (tuyến tính và phi tuyến) cần bán tích cực -được xác định ở mức tối ưu. Nếu bạn mô hình Hessian of Lagrangian thông qua BFGS và do đó hạn chế nó là xác định tích cực, nó có thể phù hợp khủng khiếp ở mọi nơi và không hoạt động tốt. Ngược lại, SR1 có thể điều chỉnh giá trị bản địa của nó với những gì nó thực sự "nhìn thấy".
Có nhiều hơn những gì tôi có thể nói về tất cả những điều này, nhưng điều này là đủ để cung cấp cho bạn một hương vị.
Chỉnh sửa : Những gì tôi viết 2 đoạn lên là chính xác. Tuy nhiên, tôi quên chỉ ra rằng nó cũng áp dụng cho các vấn đề bị ràng buộc tuyến tính. Trong trường hợp các vấn đề bị ràng buộc tuyến tính, Hessian của Lagrangian chỉ là (giảm xuống) Hessian của hàm mục tiêu. Vì vậy, điều kiện tối ưu bậc 2 cho mức tối thiểu cục bộ là phép chiếu Hessian của hàm mục tiêu vào khoảng trống của Jacobian của các ràng buộc hoạt động là bán xác định dương. Đáng chú ý nhất, Hessian của hàm mục tiêu không nhất thiết phải là psd ở mức tối ưu, và thường là không, ngay cả đối với các vấn đề bị ràng buộc tuyến tính.