KKT trong một tóm tắt đồ họa


13

Mục tiêu

Xác nhận xem sự hiểu biết về KKT có chính xác hay không. Tìm kiếm để giải thích thêm và xác nhận về KKT.

Lý lịch

Cố gắng hiểu các điều kiện KKT, đặc biệt là điều kiện bổ sung, luôn bật ra màu xanh trong các bài viết SVM. Tôi không cần danh sách các công thức trừu tượng nhưng cần một lời giải thích cụ thể, trực quan và đồ họa.

Câu hỏi

Nếu P, tối thiểu hóa hàm chi phí f (X), nằm trong ràng buộc (g (P)> = 0), thì đó là giải pháp. Có vẻ như KKT không liên quan trong trường hợp này.

nhập mô tả hình ảnh ở đây

Có vẻ như KKT nói rằng nếu P không nằm trong giới hạn, thì giải pháp X sẽ thỏa mãn bên dưới trong hình. Là KKT tất cả về hoặc tôi bỏ lỡ các khía cạnh quan trọng khác?

nhập mô tả hình ảnh ở đây

Làm rõ khác

  1. Có nên áp dụng f (x) cho KKT không?
  2. Có nên áp dụng g (x) tuyến tính cho KKT không?
  3. Có cần thiết trong λ * g (X) = 0 không? Tại sao g (X) = 0 hoặc g (Xi) = 0 là không đủ?

Người giới thiệu


Cập nhật 1

Cảm ơn câu trả lời nhưng vẫn đấu tranh để hiểu. Chỉ tập trung vào sự cần thiết ở đây:

Có phải điều kiện (2) trong câu trả lời của Matthew Gunn về điểm không tối ưu (trong vòng tròn màu xanh lá cây) và KKT sẽ không được thỏa mãn ở đó không? Và vấn đề sẽ được xác định bằng cách nhìn vào Hessian như trong câu trả lời của Mark L. Stone?

Tôi cho rằng một tình huống khác là điểm yên ngựa, nhưng áp dụng tương tự?

nhập mô tả hình ảnh ở đây

nhập mô tả hình ảnh ở đây người dùng23658


1
Câu hỏi này có thể thu hút sự chú ý nhiều hơn trên trang web toán học; Điều kiện KKT không nhất thiết là "thống kê". Các nhà thống kê mượn những kết quả này và các kết quả khác từ phân tích số để giải quyết các vấn đề thống kê thú vị, nhưng đây là một câu hỏi toán học nhiều hơn.
dùng23658

1
(1) Nếu các ràng buộc không ràng buộc, vấn đề tối ưu hóa với các ràng buộc có cùng một giải pháp như vấn đề tối ưu hóa mà không có các ràng buộc. (2) Không cần lồi hay g cần tuyến tính đối với các điều kiện KKT là cần thiết ở mức tối ưu. (3) Bạn cần các điều kiện đặc biệt (ví dụ: vấn đề lồi trong đó điều kiện Slater giữ) cho các điều kiện KKT giữ để có đủ điều kiện tối ưu. fg
Matthew Gunn

2
Ý tưởng cơ bản của tình trạng bổ sung kia tưởng đâu (tức là nơi g ( x ) 0 là một hạn chế) là nếu các hạn chế là chùng (tức là g ( x ) < 0 ) tại tối ưu x , sau đó hình phạt λ cho thắt chặt các hạn chế là 0. Và nếu có một hình phạt tích cực λ cho thắt chặt các hạn chế, sau đó hạn chế phải được ràng buộc (tức là g ( x ) = 0λg(x)=0g(x)0g(x)<0xλλg(x)=0). Nếu giao thông đang trôi chảy, phí cầu cho một chiếc xe khác bằng không. Và nếu cầu thu phí λ > 0 , thì cầu phải ở giới hạn công suất. λλ>0
Matthew Gunn

1
Định lý KKT cơ bản nói rằng nếu các điều kiện KKT không thỏa mãn tại điểm , thì điểm x không tối ưu. Các điều kiện KKT là cần thiết cho tối ưu nhưng không đủ. (Ví dụ: nếu chức năng có điểm yên ngựa, cực tiểu cục bộ, v.v ... điều kiện KKT có thể được thỏa mãn nhưng điểm không tối ưu!) Đối với một số loại vấn đề nhất định (ví dụ: vấn đề lồi trong đó điều kiện của Slater), KKT điều kiện trở thành điều kiện đủ . xx
Matthew Gunn

Câu trả lời:


8

Ý tưởng cơ bản của các điều kiện KKT như điều kiện cần thiết cho một tối ưu là nếu họ không giữ tại một điểm khả thi , sau đó có tồn tại một hướng δ rằng sẽ cải thiện mục tiêu f mà không tăng (và do đó có thể vi phạm) những hạn chế. (Nếu điều kiện KKT không giữ ở x thì x không thể là tối ưu, do đó điều kiện KKT là cần thiết để một điểm là tối ưu.)xδfxx

Hãy tưởng tượng bạn có vấn đề tối ưu hóa:

minimize (over x)f(x)subject toj{1k}gj(x)0

Trong đó và có k ràng buộc.xRnk

Điều kiện KKT và bổ đề Farkas

Hãy là một vector cột biểu thị gradient của f đánh giá ở x .f(x)fx

Áp dụng cho tình huống này, Farkas Lemma tuyên bố rằng đối với bất kỳ điểm chính xác, một trong các câu sau đây đều được giữ:xRn

  1. Có tồn tại đến nỗi Σ k j = 1 λ jg j ( x ) = - f ( x )λ 0λRkj=1kλjgj(x)=f(x)λ0
  2. Có tồn tại j δ ' g j ( x ) 0δ 'f ( x ) < 0δRnjδgj(x)0δf(x)<0

Điều đó có nghĩa là gì? Điều đó có nghĩa là đối với bất kỳ điểm khả thi , một trong hai:x

  • Điều kiện (1) giữ và các điều kiện KKT được thỏa mãn.
  • Điều kiện (2) nắm giữ và tồn tại một hướng khả thi để cải thiện hàm mục tiêu f mà không làm tăng khó khăn g j . (ví dụ. bạn có thể cải thiện f bằng cách di chuyển từ x đến x + ε delta )δfgjfxx+ϵδ

Điều kiện (1) nói rằng tồn tại các bội số không âm sao cho các điều kiện KKT được thỏa mãn tại điểm x . (Về mặt hình học, nó nói rằng - f nằm trong hình nón lồi được xác định bởi độ dốc của các ràng buộc.)λxf

Điều kiện (2) nói rằng tại điểm , tồn tại hướng δ để di chuyển (cục bộ) sao cho:xδ

  • Di chuyển theo hướng giảm hàm mục tiêu (vì chấm sản phẩm của f ( x )δ là nhỏ hơn không).δf(x)δ
  • Di chuyển theo hướng không làm tăng giá trị của những hạn chế (vì chấm sản phẩm của g j ( x )δ là nhỏ hơn hoặc bằng số không cho tất cả các trở ngại j ).δgj(x)δj

(Hình học, có tính khả thi hướng định nghĩa một siêu phẳng tách giữa vector - f ( x ) và lồi hình nón được xác định bởi các vectơ g j ( x ) .)δf(x)gj(x)

(Lưu ý: để lập bản đồ này vào Bổ đề Farkas , xác định ma trận )A=[g1,g2,,gk]

Lập luận này cung cấp cho bạn sự cần thiết (nhưng không đủ) của các điều kiện KKT ở mức tối ưu. Nếu điều kiện KKT không được thỏa mãn (và trình độ ràng buộc được thỏa mãn), có thể cải thiện mục tiêu mà không vi phạm các ràng buộc.

Vai trò của trình độ ràng buộc

Cái mà có thể sai lầm? Bạn có thể nhận được các tình huống suy biến trong đó độ dốc của các ràng buộc không mô tả chính xác các hướng khả thi để di chuyển vào.

Có vô số trình độ ràng buộc khác nhau để lựa chọn sẽ cho phép đối số trên hoạt động.

Giải thích tối thiểu, tối đa (imho trực quan nhất)

Hình thành Lagrangian

L(x,λ)=f(x)+j=1kλjgj(x)

fgjLλi

Giải pháp cho vấn đề tối ưu hóa ban đầu tương đương với:

minxmaxλL(x,λ)

Đó là:

  1. xL
  2. λx

g2λ2

Nhị nguyên

f(x,y)

x^,y^minxf(x,y^)f(x^,y^)maxyf(x^,y)

x^y^

maxyminxf(x,y)minxmaxyf(x,y)

maxλminxL(x,λ)minxmaxλL(x,λ)

maxλminxL(x,λ)

Nhị nguyên mạnh mẽ

Trong một số điều kiện đặc biệt (ví dụ: vấn đề lồi trong đó điều kiện Slater giữ), bạn có tính đối ngẫu mạnh mẽ (tức là thuộc tính điểm yên ngựa).

maxλminxL(x,λ)=minxmaxλL(x,λ)

Kết quả đẹp này ngụ ý bạn có thể đảo ngược thứ tự của vấn đề.

  1. λ

  2. xL

λ


Đánh giá cao thông tin và các liên kết để lấp đầy khoảng trống của sự hiểu biết. Cho phép tôi xác nhận. Điều kiện (1) có nghĩa là KKT nói rằng điểm X là một giải pháp, nó cần thỏa mãn λ * g (X) = 0, λ> = 0 và độ dài của độ dốc của g (X) là λ lần của f (X), nếu không chúng ta sẽ tìm thấy độ dốc của hướng f (X) trong đó có thể tìm thấy f (X ') nhỏ hơn?
mon

3
Điều kiện Slater là (chỉ) một trình độ ràng buộc có thể được áp dụng cho các vấn đề tối ưu hóa lồi, tức là làm cho KKT cần thiết. Lồi lõm làm cho KKT đủ. Vì vậy, điều kiện Slater cho vấn đề tối ưu hóa lồi trong đó hàm mục tiêu và các ràng buộc là lồi và liên tục khác biệt làm cho KKT cần thiết và đủ cho mức tối thiểu toàn cầu. Điều kiện Slater là có ít nhất một điểm khả thi (nghĩa là thỏa mãn tất cả các ràng buộc) nằm trong phần bên trong của tất cả các ràng buộc phi tuyến (bất cứ điều gì đi với các ràng buộc tuyến tính, miễn là khả thi).
Mark L. Stone

5

f (x) là lồi là cần thiết để KKT đủ để x là tối thiểu cục bộ. Nếu f (x) hoặc -g (x) không lồi, x KKT thỏa mãn có thể là tối thiểu cục bộ, yên ngựa hoặc tối đa cục bộ.

g (x) là tuyến tính, cùng với f (x) liên tục khác biệt là đủ cho các điều kiện KKT là cần thiết cho tối thiểu cục bộ. g (x) là tuyến tính có nghĩa là tiêu chuẩn ràng buộc tuyến tính cho KKT là không cần thiết cho mức tối thiểu cục bộ được thỏa mãn. Tuy nhiên, có những bằng cấp ràng buộc ít hạn chế khác đủ cho các điều kiện KKT là cần thiết cho tối thiểu địa phương. Xem phần Điều kiện thường xuyên (hoặc trình độ ràng buộc) của https://en.wikipedia.org/wiki/Karush%E2%80%93Kuhn%E2%80%93Tucker_conditions .

Nếu mức tối thiểu cục bộ không có ràng buộc "hoạt động" (do đó, trong trường hợp chỉ có ràng buộc bất đẳng thức, ràng buộc đó không thỏa mãn với đẳng thức), thì số nhân Lagrange liên quan đến các ràng buộc đó phải bằng 0, trong trường hợp đó, KKT giảm xuống theo điều kiện độ dốc của mục tiêu = 0. Trong trường hợp như vậy, không có "chi phí" nào cho giá trị mục tiêu tối ưu của việc thắt chặt epsilon của ràng buộc.

Thông tin thêm :

Chức năng khách quan và các ràng buộc là lồi và liên tục khác biệt ngụ ý KKT là đủ cho tối thiểu toàn cầu.

Nếu hàm mục tiêu và các ràng buộc liên tục khác nhau và các ràng buộc thỏa mãn một tiêu chuẩn ràng buộc, KKT là cần thiết cho mức tối thiểu cục bộ.

Nếu hàm mục tiêu và các ràng buộc liên tục khác nhau, lồi và các ràng buộc thỏa mãn một tiêu chuẩn ràng buộc, KKT là cần thiết và đủ cho mức tối thiểu toàn cầu.

ZZTHZHlà người Hessian của Lagrangian. Các ràng buộc tích cực bao gồm tất cả các ràng buộc bình đẳng cộng với tất cả các ràng buộc bất đẳng thức được thỏa mãn với đẳng thức tại điểm đang xem xét. Nếu không có ràng buộc nào được kích hoạt tại điểm KKT bậc 1 đang được xem xét, ma trận danh tính là cơ sở nullspaceZ

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.