Hiểu chi phí của phương pháp kết hợp để tối ưu hóa ràng buộc pde


11

Tôi đang cố gắng hiểu phương thức tối ưu hóa dựa trên điều chỉnh hoạt động như thế nào đối với tối ưu hóa bị ràng buộc PDE. Đặc biệt, tôi đang cố gắng hiểu tại sao phương thức kết hợp hiệu quả hơn cho các vấn đề trong đó số lượng biến thiết kế lớn, nhưng "số phương trình nhỏ".

Những gì tôi hiểu:

Hãy xem xét vấn đề tối ưu hóa bị ràng buộc PDE sau đây:

minβ I(β,u(β))s.t.R(u(β))=0

Trong đó I là hàm mục tiêu (đủ liên tục) của biến thiết kế vectơ β và vectơ của biến trường không xác định u(β) phụ thuộc vào các biến thiết kế và R(u) là dạng dư của PDE.

Rõ ràng, chúng ta có thể biến thể đầu tiên của I và R là

δI=Iβδβ+Iuδu

δR=Rβδβ+Ruδu=0

Giới thiệu một vectơ của số nhân lagrange λ , biến thể của hàm mục tiêu có thể được viết là

δI=Iβδβ+Iuδu+λT[Rβδβ+Ruδu]

Sắp xếp lại các điều khoản, chúng ta có thể viết:

δI=[Iβ+λTRβ]δβ+[Iu+λTRu]δu

Do đó, nếu chúng tôi có thể giải quyết cho sao choλ

Iu+λTRu=0 (adjoint equation)

Sau đó, độ dốc được đánh giá chỉ xét về các biến thiết kế .δI=[Iβ+λTRβ]δββ

Do đó, một thuật toán tối ưu hóa dựa trên kết hợp sẽ lặp qua các bước sau:

  1. Đưa ra các biến thiết kế hiện tạiβ
  2. Giải các biến trường (từ PDE)u
  3. Giải các bội số trễ (từ phương trình liên kết)λ
  4. Tính toán độ dốcIβ
  5. Cập nhật biến thiết kếβ

Câu hỏi của tôi

Làm thế nào để điều chỉnh 'mẹo' này cải thiện chi phí tối ưu hóa cho mỗi lần lặp trong trường hợp số lượng biến thiết kế lớn? Tôi đã nghe nói rằng chi phí đánh giá độ dốc cho phương thức kết hợp là 'độc lập' với số lượng biến thiết kế. Nhưng chính xác thì điều này đúng như thế nào?

Tôi chắc chắn có một cái gì đó rất rõ ràng mà bằng cách nào đó tôi đang nhìn.


3
Nhân tiện, hệ số nhân Lagrange thường được thêm vào hàm mục tiêu, không phải là biến thể; do đó . Đặt đạo hàm tương ứng với thành 0 sẽ tạo ra phương trình liên kết và chèn phương trình này (và giải pháp của phương trình trạng thái ) vào đạo hàm tương ứng với tạo ra độ dốc. Nếu bạn bắt đầu với công thức yếu của PDE, mọi thứ thậm chí còn đơn giản hơn: Chỉ cần chèn hệ số nhân Lagrange thay cho chức năng kiểm tra. Không cần hình thức mạnh mẽ hoặc tích hợp một phần bất cứ nơi nào. minu,βmaxλI(u,β)+λTR(u,β)uuR(u,β)=0β
Christian Clason

1
Phần đắt nhất của bất kỳ mô phỏng nào là giai đoạn giải quyết. Bằng cách sử dụng phép bổ trợ, bạn có được độ dốc trong hai lần giải, rẻ hơn nhiều so với sự khác biệt hữu hạn trong đó bạn ít nhất cần n + 1 giải, n là số lượng tham số miễn phí trong mô hình của bạn.
stali

Câu trả lời:


10

Làm thế nào để điều chỉnh 'mẹo' này cải thiện chi phí tối ưu hóa cho mỗi lần lặp trong trường hợp số lượng biến thiết kế lớn?

Tôi nghĩ về chi phí từ quan điểm đại số tuyến tính. (Xem những ghi chú của Stephen G. Johnson , mà tôi thấy trực quan hơn so với phương pháp nhân số Lagrange). Cách tiếp cận phía trước có thể giải quyết vấn đề nhạy cảm trực tiếp:

uβ=(Ru)1Rβ

liên quan đến việc giải quyết một hệ thống tuyến tính cho từng tham số trong vectơ , sau đó đánh giáβ

dIdβ=Iβ+Iuuβ,

trong đó biểu thị một đạo hàm tổng và biểu thị một đạo hàm riêng.d

Phương pháp tiếp cận ghi chú rằng

dIdβ=IβIu(Ru)1Rβ,

do đó, biến số liên kết (số nhân Lagrange) có thể được xác định bởiλ

Iu(Ru)1=λT,

tương ứng với phương trình liên kết

Iu+λTRu=0.

Việc sắp xếp lại các thuật ngữ này chỉ yêu cầu một giải pháp tuyến tính, thay vì giải quyết tuyến tính cho từng tham số, điều này làm cho việc đánh giá điều chỉnh trở nên rẻ đối với nhiều trường hợp tham số.

Tôi đã nghe nói rằng chi phí đánh giá độ dốc cho phương thức kết hợp là 'độc lập' với số lượng biến thiết kế. Nhưng chính xác thì điều này đúng như thế nào?

Nó không hoàn toàn độc lập; có lẽ chi phí đánh giá và sẽ tăng theo số lượng tham số. Tuy nhiên, các giải tuyến tính vẫn sẽ có cùng kích thước, miễn là kích thước của không thay đổi. Giả định là các giải pháp đắt hơn nhiều so với các đánh giá chức năng.(I/β)(R/β)u


8

Tóm lại, lợi thế đến từ việc tính toán các dẫn xuất của mục tiêu giảm , bạn không thực sự cần biết đạo hàm của đối với là một đối tượng riêng biệt, nhưng chỉ một phần của nó dẫn đến các biến thể trong .I(β,u(β))u(β)βI(β,u(β))

Hãy để tôi chuyển sang một ký hiệu Tôi thấy thoải mái hơn một chút với: ( là biến thiết kế, là biến trạng thái và là mục tiêu). Giả sử đủ tốt để áp dụng định lý hàm ẩn, vì vậy phương trình có một nghiệm duy nhất liên tục khác biệt với và đạo hàm được cho bởi giải pháp của ( và là đạo hàm riêng) .

miny,uJ(y,u)subject toe(y,u)=0
uyJe(y,u)e(y,u)=0y(u)uy(u)
(1)ey(y(u),u)y(u)+eu(y(u),u)=0
eyeu

Điều này có nghĩa là bạn có thể xác định mục tiêu giảm , cũng có thể phân biệt (nếu là). Một cách để mô tả độ dốc là thông qua các đạo hàm định hướng (ví dụ: tính tất cả các đạo hàm riêng đối với cơ sở của không gian thiết kế). Ở đây, đạo hàm theo hướng được quy định bởi chuỗi quy tắc là Nếu đẹp, điều khó khăn duy nhất để tính toán là cho . Điều này có thể được thực hiện bằng cách nhân vớij(u):=J(y(u),u)J(y,u)j(u)h

(2)j(u;h)=Jy(y(u),u),y(u)h+Ju(y(u),u),h.
Jy(u)hh(1)htừ bên phải và giải cho (mà định lý hàm ẩn cho phép), tức là tính toán và cắm biểu thức này vào . Trong tối ưu hóa PDE-hạn chế, số tiền này để giải quyết một PDE linearized cho mỗi cơ sở vector của không gian thiết kế.y(u)h
(3)[y(u)h]=ey(y(u),u)1[eu(y(u),u)h]
(2) h

Tuy nhiên, nếu chúng ta tìm thấy một toán tử sao cho thì đây phải là độ dốc mong muốn. Nhìn vào , chúng ta có thể viết (với là toán tử điều chỉnh), vì vậy tất cả những gì chúng ta cần tính là . Sử dụng , điều này có thể được thực hiện bằng cách sử dụng , tức là tính toán và cài đặt Trong tối ưu hóa bị ràng buộc PDE,j

j(u;h)=j,hfor all h,
(1)
Jy(y(u),u),y(u)h=y(u)Jy(y(u),u),h
y(u)y(u)jy(y(u),u)(AB)=BA(3)
λ:=ey(y(u),u)Jy(y(u),u)
j(u)=eu(y(u),u)λ+Ju(y(u),u).
Jy(y(u),u)thường là một số phần dư và tính toán liên quan đến việc giải quyết một PDE duy nhất (tuyến tính), độc lập với kích thước của không gian thiết kế. (Trong thực tế, điều này thậm chí hoạt động cho các tham số phân tán, nghĩa là, nếu là một hàm trong một không gian Banach vô hạn, trong đó cách tiếp cận đầu tiên là không khả thi.)λu
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.