Giải phương trình Hamilton-Jacobi-Bellman; Cần và đủ cho sự tối ưu?


13

Xét phương trình vi phân sau trong đó là trạng thái và là biến điều khiển. Giải pháp được đưa ra bởi trong đó là trạng thái ban đầu đã cho.

x˙(t)=f(x(t),u(t))
xu
x(t)=x0+0tf(x(s),u(s))ds.
x0:=x(0)

Bây giờ hãy xem xét chương trình sau trong đó \ rho> 0 biểu thị tùy chọn thời gian, V (\ cdot) là giá trị và F (\ cdot) một hàm mục tiêu. Một ứng dụng kinh tế cổ điển là mô hình tăng trưởng tối ưu Ramsey-Cass-Koopmans. Phương trình Hamilton-Jacobi-Bellman được đưa ra bởi \ started {align} \ rho V (x) = \ max_u [F (x, u) + V '(x) f (x, u)], \ quad \ forall t \ trong [0, \ infty). \ end {căn chỉnh}

V(x0):=maxu0eρtF(x(t),u(t))dts.t. x˙(t)=f(x(t),u(t))x(0)=x0
ρ>0V()F()
ρV(x)=maxu[F(x,u)+V(x)f(x,u)],t[0,).

Nói rằng tôi đã giải quyết được HJB cho V . Điều khiển tối ưu sau đó được đưa ra bởi

u=argmaxu[F(x,u)+V(x)f(x,u)].
Tôi sẽ nhận được quỹ đạo tối ưu cho trạng thái và kiểm soát {(x(t),u(t)):t[0,)} .

Các wiki bài viết nói

... nhưng khi được giải quyết trên toàn bộ không gian trạng thái, phương trình HJB là điều kiện cần và đủ để tối ưu.

Trong Bertsekas (2005) Lập trình động và điều khiển tối ưu , Tập 1, tái bản lần 3, trong Dự luật 3.2.1, ông nói rằng giải quyết cho V là chức năng chi phí tối ưu và u ^ * liên quan ulà tối ưu. Tuy nhiên, ông tuyên bố rõ ràng nó là một định lý đầy đủ.

Trên thực tế, tôi chỉ muốn chắc chắn rằng, nếu tôi đã giải quyết HJB và khôi phục trạng thái liên quan và quỹ đạo kiểm soát, tôi không phải lo lắng về bất kỳ điều kiện tối ưu bổ sung nào.

Giải pháp

Toi thu

Tôi nghĩ rằng tôi đã có thể rút ra các điều kiện cần thiết từ nguyên tắc tối đa bằng chính phương trình HJB.

Xác định hamiltonian started

H(x,u,V(x)):=F(x,u)+V(x)f(x,u)

thì ta có

ρV(x)=maxuH(x,u,V(x))

đó là

ρV(x)=H(x,u,V(x)).

Xác định hàm tùy ý với . Bây giờ hãy sửa q ( 0 ) = lim t q ( t ) = 0 x = x + ε qq:[0,)Rq(0)=limtq(t)=0

x=x+εq

trong đó là một tham số. Cắm thuật ngữ vào hamiltonian tối đa hóa cho ρ V ( x + ε q ) = H ( x + ε q , u , V ( x + ε q ) ) .εR

ρV(x+εq)=H(x+εq,u,V(x+εq)).

Tại chúng tôi có giải pháp tối ưu. Do đó, hãy phân biệt để có điều kiện đặt hàng đầu tiên ε ρ V q = H x q + H V V q .ε=0ε

ρVq=Hxq+HVVq.

Bây giờ hãy xác định biến adjoint với

λ=V(x).

Phân biệt theo thời gian

λ˙=Vx˙.

và lưu ý rằng

HV=f(x,u)=x˙.

Cắm mọi thứ vào foc wich sẽ cho

ρλ=Hx+λ˙.

Đó là khá nhiều. Vì vậy, giải quyết HJB là thực sự cần thiết và đủ (bỏ qua ở đây) cho sự tối ưu. Ai đó nên thêm nó vào wiki. Có thể tiết kiệm thời gian cho mọi người nghĩ về những vấn đề như vậy (tôi sẽ không nghĩ nhiều).

Tuy nhiên, điều kiện chuyển đổi bị thiếu.

limteρtλ(t)=0

II Cố gắng

Xác định chức năng hoàn trả

J(u):=0eρtF(x,u)dt

Lưu ý rằng theo định nghĩa của . Thêm Thuật ngữ trung lập vào danh sách hoàn trả

0eρtλ[f(x,u)x˙]dt=0
x˙=f(x,u)
J(u)=0eρt[F(x,u)+λf(x,u)]dt0eρtλx˙dt=0eρtH(x,u,λ)0eρtλx˙dt

Tích hợp bởi các phần của thuật ngữ đúng, mang lại lợi nhuận

0eρtλx˙dt=[eρtλ(t)x(t)]00eρtx(λ˙ρλ)dt

Đặt lại thuật ngữ đó started

J(u)=0eρt[H(x,u,λ)+x(λ˙ρλ)]dtlimteρtλ(t)x(t)+λ(0)x(0)

Xác định

x=x+εqu=u+εp

cung cấp cho

J(ε)=0eρt[H(x+εq,u+εp,λ)+(x+εq)(λ˙ρλ)]dtlimteρtλ(t)[x(t)+εq(t)]+λ(0)x(0)

FOC cho tối đaJε=0

Jε=0eρt[Hxq+Hup+q(λ˙ρλ)]dtlimteρtλ(t)q(t)=0

Vì và không bị giới hạn, chúng tôi phải có qp

Hu=0Hx=ρλλ˙limteρtλ(t)=0

Bạn đã xác định các điều kiện cần và đủ chưa?
Jamzy

Trong bối cảnh kinh tế nào điều này đi lên?
Stan Shunpike


1
Tôi nghĩ rằng chủ đề này phù hợp hơn với math.stackexchange.com vì nó không thực sự liên kết với econ. Một mod có thể chuyển nó.
không biết gì vào

Tôi không chắc chắn những gì được hỏi ở đây: nếu mỗi lần giải quyết HJB của Bertsekas là đủ , thì bạn không phải "lo lắng về các điều kiện tối ưu bổ sung". "Chỉ đủ" chống lại "cần và đủ" sẽ phát sinh trong trường hợp HJB không được giải quyết - trong trường hợp đó người ta sẽ nói "điều này không có nghĩa là không có giải pháp". Nhân tiện, Nỗ lực I và II của bạn là nội dung có giá trị ở đây - lần đầu tiên hiển thị một liên kết giữa HJB và Điều khiển tối ưu, lần thứ hai cho thấy cách FOCs điều khiển tối ưu có thể được bắt nguồn.
Alecos Papadopoulos

Câu trả lời:


1

(Điều này có lẽ nên được coi là một nhận xét.)

Nếu bạn đã giải phương trình HJB, nó là đủ để có được giải pháp tối ưu. Vì vậy, bạn không "phải quan tâm đến bất kỳ điều kiện tối ưu nào khác", mà tôi tin rằng dường như để trả lời câu hỏi của bạn.

Dường như bạn quan tâm đến thành phần "cần thiết" của định lý. Mặt cần thiết của câu lệnh như sau: nếu có một giải pháp tối ưu, thì phải tồn tại một giải pháp cho phương trình HJB.

Tôi đã không làm việc với vấn đề cụ thể này, nhưng câu trả lời nói chung là chúng tôi không mong đợi có một hàm khác biệt V. Do đó chúng tôi không có giải pháp cho phương trình như đã nêu. Thay vào đó, chúng ta cần xem xét các đạo hàm tổng quát và chuyển đổi phương trình HJB thành bất đẳng thức. Trong trường hợp đó, bạn có thể nhận được "giải pháp độ nhớt". Nếu chúng ta mở rộng để sử dụng các dẫn xuất tổng quát, có thể chứng minh rằng một giải pháp như vậy luôn tồn tại. Liếc nhìn bằng chứng của bạn, họ sẽ không giúp đỡ về các điều kiện cần thiết, vì bạn đang giả định sự khác biệt.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.