Ý tưởng cơ bản của các điều kiện KKT như điều kiện cần thiết cho một tối ưu là nếu họ không giữ tại một điểm khả thi , sau đó có tồn tại một hướng δ rằng sẽ cải thiện mục tiêu f mà không tăng (và do đó có thể vi phạm) những hạn chế. (Nếu điều kiện KKT không giữ ở x thì x không thể là tối ưu, do đó điều kiện KKT là cần thiết để một điểm là tối ưu.)xδfxx
Hãy tưởng tượng bạn có vấn đề tối ưu hóa:
minimize (over x)subject tof(x)∀j∈{1…k}gj(x)≤0
Trong đó và có k ràng buộc.x∈Rnk
Hãy là một vector cột biểu thị gradient của f đánh giá ở x .∇f(x)fx
Áp dụng cho tình huống này, Farkas Lemma tuyên bố rằng đối với bất kỳ điểm chính xác, một trong các câu sau đây đều được giữ:x∈Rn
- Có tồn tại đến nỗi Σ k j = 1 λ j ∇ g j ( x ) = - ∇ f ( x ) và λ ≥ 0λ∈Rk∑kj=1λj∇gj(x)=−∇f(x)λ≥0
- Có tồn tại mà ∀ j δ ' g j ( x ) ≤ 0 và δ ' ∇ f ( x ) < 0δ∈Rn∀jδ′gj(x)≤0δ′∇f(x)<0
Điều đó có nghĩa là gì? Điều đó có nghĩa là đối với bất kỳ điểm khả thi , một trong hai:x
- Điều kiện (1) giữ và các điều kiện KKT được thỏa mãn.
- Điều kiện (2) nắm giữ và tồn tại một hướng khả thi để cải thiện hàm mục tiêu f mà không làm tăng khó khăn g j . (ví dụ. bạn có thể cải thiện f bằng cách di chuyển từ x đến x + ε delta )δfgjfxx+ϵδ
Điều kiện (1) nói rằng tồn tại các bội số không âm sao cho các điều kiện KKT được thỏa mãn tại điểm x . (Về mặt hình học, nó nói rằng - ∇ f nằm trong hình nón lồi được xác định bởi độ dốc của các ràng buộc.)λx−∇f
Điều kiện (2) nói rằng tại điểm , tồn tại hướng δ để di chuyển (cục bộ) sao cho:xδ
- Di chuyển theo hướng giảm hàm mục tiêu (vì chấm sản phẩm của ∇ f ( x ) và δ là nhỏ hơn không).δ∇f(x)δ
- Di chuyển theo hướng không làm tăng giá trị của những hạn chế (vì chấm sản phẩm của ∇ g j ( x ) và δ là nhỏ hơn hoặc bằng số không cho tất cả các trở ngại j ).δ∇gj(x)δj
(Hình học, có tính khả thi hướng định nghĩa một siêu phẳng tách giữa vector - ∇ f ( x ) và lồi hình nón được xác định bởi các vectơ ∇ g j ( x ) .)δ−∇f(x)∇gj(x)
(Lưu ý: để lập bản đồ này vào Bổ đề Farkas , xác định ma trận )A=[∇g1,∇g2,…,∇gk]
Lập luận này cung cấp cho bạn sự cần thiết (nhưng không đủ) của các điều kiện KKT ở mức tối ưu. Nếu điều kiện KKT không được thỏa mãn (và trình độ ràng buộc được thỏa mãn), có thể cải thiện mục tiêu mà không vi phạm các ràng buộc.
Vai trò của trình độ ràng buộc
Cái mà có thể sai lầm? Bạn có thể nhận được các tình huống suy biến trong đó độ dốc của các ràng buộc không mô tả chính xác các hướng khả thi để di chuyển vào.
Có vô số trình độ ràng buộc khác nhau để lựa chọn sẽ cho phép đối số trên hoạt động.
Giải thích tối thiểu, tối đa (imho trực quan nhất)
Hình thành Lagrangian
L(x,λ)=f(x)+∑j=1kλjgj(x)
fgjLλi
Giải pháp cho vấn đề tối ưu hóa ban đầu tương đương với:
minxmaxλL(x,λ)
Đó là:
- xL
- λx
g2λ2
Nhị nguyên
f(x,y)
∀x^,y^minxf(x,y^)≤f(x^,y^)≤maxyf(x^,y)
x^y^
maxyminxf(x,y)≤minxmaxyf(x,y)
maxλminxL(x,λ)≤minxmaxλL(x,λ)
maxλminxL(x,λ)
Nhị nguyên mạnh mẽ
Trong một số điều kiện đặc biệt (ví dụ: vấn đề lồi trong đó điều kiện Slater giữ), bạn có tính đối ngẫu mạnh mẽ (tức là thuộc tính điểm yên ngựa).
maxλminxL(x,λ)=minxmaxλL(x,λ)
Kết quả đẹp này ngụ ý bạn có thể đảo ngược thứ tự của vấn đề.
λ
xL
λ