Xét phương trình vi phân sau trong đó là trạng thái và là biến điều khiển. Giải pháp được đưa ra bởi trong đó là trạng thái ban đầu đã cho.
Bây giờ hãy xem xét chương trình sau trong đó \ rho> 0 biểu thị tùy chọn thời gian, V (\ cdot) là giá trị và F (\ cdot) một hàm mục tiêu. Một ứng dụng kinh tế cổ điển là mô hình tăng trưởng tối ưu Ramsey-Cass-Koopmans. Phương trình Hamilton-Jacobi-Bellman được đưa ra bởi \ started {align} \ rho V (x) = \ max_u [F (x, u) + V '(x) f (x, u)], \ quad \ forall t \ trong [0, \ infty). \ end {căn chỉnh}
Nói rằng tôi đã giải quyết được HJB cho . Điều khiển tối ưu sau đó được đưa ra bởi
Các wiki bài viết nói
... nhưng khi được giải quyết trên toàn bộ không gian trạng thái, phương trình HJB là điều kiện cần và đủ để tối ưu.
Trong Bertsekas (2005) Lập trình động và điều khiển tối ưu , Tập 1, tái bản lần 3, trong Dự luật 3.2.1, ông nói rằng giải quyết cho là chức năng chi phí tối ưu và u ^ * liên quan là tối ưu. Tuy nhiên, ông tuyên bố rõ ràng nó là một định lý đầy đủ.
Trên thực tế, tôi chỉ muốn chắc chắn rằng, nếu tôi đã giải quyết HJB và khôi phục trạng thái liên quan và quỹ đạo kiểm soát, tôi không phải lo lắng về bất kỳ điều kiện tối ưu bổ sung nào.
Giải pháp
Toi thu
Tôi nghĩ rằng tôi đã có thể rút ra các điều kiện cần thiết từ nguyên tắc tối đa bằng chính phương trình HJB.
Xác định hamiltonian started
thì ta có
đó là
Xác định hàm tùy ý với . Bây giờ hãy sửa q ( 0 ) = lim t → ∞ q ( t ) = 0 x = x ∗ + ε q
trong đó là một tham số. Cắm thuật ngữ vào hamiltonian tối đa hóa cho ρ V ( x ∗ + ε q ) = H ( x ∗ + ε q , u ∗ , V ′ ( x ∗ + ε q ) ) .
Tại chúng tôi có giải pháp tối ưu. Do đó, hãy phân biệt để có điều kiện đặt hàng đầu tiên ε ρ V ′ q = H x q + H V ′ V ″ q .
Bây giờ hãy xác định biến adjoint với
Phân biệt theo thời gian
và lưu ý rằng
Cắm mọi thứ vào foc wich sẽ cho
Đó là khá nhiều. Vì vậy, giải quyết HJB là thực sự cần thiết và đủ (bỏ qua ở đây) cho sự tối ưu. Ai đó nên thêm nó vào wiki. Có thể tiết kiệm thời gian cho mọi người nghĩ về những vấn đề như vậy (tôi sẽ không nghĩ nhiều).
Tuy nhiên, điều kiện chuyển đổi bị thiếu.
II Cố gắng
Xác định chức năng hoàn trả
Lưu ý rằng theo định nghĩa của . Thêm Thuật ngữ trung lập vào danh sách hoàn trả
Tích hợp bởi các phần của thuật ngữ đúng, mang lại lợi nhuận
Đặt lại thuật ngữ đó started
Xác định
cung cấp cho
FOC cho tối đa
Vì và không bị giới hạn, chúng tôi phải có