Kiểm tra phương pháp tối ưu hóa số: Rosenbrock so với các chức năng kiểm tra thực

15

Dường như có hai loại chức năng thử nghiệm chính cho tối ưu hóa không phái sinh:

một lớp lót như hàm Rosenbrock ff., với điểm bắt đầu
tập hợp các điểm dữ liệu thực, với bộ nội suy

Có thể so sánh nói 10d Rosenbrock với bất kỳ vấn đề 10d thực sự nào không?
Người ta có thể so sánh theo nhiều cách khác nhau: mô tả cấu trúc của cực tiểu cục bộ
hoặc chạy tối ưu hóa ABC trên Rosenbrock và về một số vấn đề thực tế;
nhưng cả hai điều này có vẻ khó khăn

(Có lẽ các nhà lý thuyết và thí nghiệm chỉ là hai nền văn hóa khá khác nhau, vì vậy tôi đang yêu cầu một con chimera?)

Xem thêm:

scicomp.SE câu hỏi: Trường hợp nào người ta có thể có được các tập dữ liệu / vấn đề kiểm tra tốt để kiểm tra các thuật toán / thói quen?
Hooker, "Kiểm tra Heuristic: We Have It All Wrong" thật đáng sợ: "sự nhấn mạnh vào cạnh tranh ... cho chúng ta biết thuật toán nào tốt hơn nhưng không phải tại sao."

(Added trong tháng 9 năm 2014):
Cốt truyện dưới đây so sánh 3 thuật toán DFO trên 14 chức năng thử nghiệm trong 8d từ 10 điểm bắt đầu ngẫu nhiên: BOBYQA Praxis SBPLX từ NLOpt chức năng kiểm tra 14 N-chiều, Python dưới gist.github từ này Matlab bởi A . Hedar 10 điểm bắt đầu ngẫu nhiên thống nhất trong hộp giới hạn của mỗi chức năng.

\times

$\times$

\times

$\times$

Trên Ackley, ví dụ, hàng trên cùng cho thấy SBPLX là tốt nhất và PRAXIS khủng khiếp; trên Schwefel, bảng dưới cùng bên phải hiển thị SBPLX tìm tối thiểu trên điểm bắt đầu ngẫu nhiên thứ 5.

Nhìn chung, BOBYQA là tốt nhất trên 1, PRAXIS trên 5 và SBPLX (~ Nelder-Mead với khởi động lại) trên 7 trong số 13 chức năng kiểm tra, với Powersum một lần tung. YMMV! Cụ thể, Johnson nói: "Tôi sẽ khuyên bạn không nên sử dụng hàm-giá trị (ftol) hoặc dung sai tham số (xtol) trong tối ưu hóa toàn cầu."

Kết luận: không đặt tất cả tiền của bạn vào một con ngựa hoặc trên một chức năng kiểm tra.

nhập mô tả hình ảnh ở đây

optimization data-sets

— từ chối
nguồn

13

Các hàm đơn giản như của Rosenbrock được sử dụng để gỡ lỗi và kiểm tra trước các thuật toán mới được viết: Chúng nhanh chóng thực hiện và thực thi, và một phương pháp không thể giải quyết tốt các vấn đề tiêu chuẩn khó có thể hoạt động tốt trên các vấn đề thực tế.

Để so sánh kỹ lưỡng gần đây về các phương pháp không có đạo hàm cho các hàm đắt tiền, hãy xem tối ưu hóa không có đạo hàm: Đánh giá các thuật toán và so sánh các triển khai phần mềm . LM Rios, NV Sahinidis - doi 10.1007 / s10898-012-9951-y Tạp chí Tối ưu hóa toàn cầu, 2012. (Xem thêm trang web đi kèm: http://archimedes.cheme.cmu.edu/?q=dfocomp )

— Arnold Neumaier
nguồn

Giáo sư Neumaier, bạn có thể chỉ ra một số vấn đề thực sự, bằng chứng, cho "một phương pháp không thể giải quyết tốt các vấn đề tiêu chuẩn không có khả năng hoạt động tốt trên các vấn đề thực tế trong cuộc sống"? Tôi nhận ra rằng điều đó không dễ dàng. (Tôi sẽ quan tâm đến nhận xét của bạn về Hooker.) Ngoài ra, một cái nhìn nhanh về các mô hình c từ liên kết của bạn cho thấy Princeetonlibgloballib yêu cầu AMPL và source_convexmodels * .c đều bị thiếu ";" sau fscanf () - tầm thường nhưng

— denis

@Denis: Các vấn đề như Rosenbrock bắt nguồn từ những ngày đầu tối ưu hóa tự động, nơi mọi người cô lập những khó khăn điển hình trong các ví dụ đại diện đơn giản có thể được nghiên cứu mà không có sự phức tạp về số lượng của các vấn đề thực tế. Do đó, chúng không thực sự nhân tạo, nhưng mô hình đơn giản hóa những khó khăn thực sự. Ví dụ, Rosenbrock minh họa hiệu ứng kết hợp của phi tuyến mạnh và tình trạng bệnh nhẹ.

— Arnold Neumaier

Trang web AMPL ampl.com cung cấp phiên bản sinh viên miễn phí cho AMPL.

— Arnold Neumaier

7

Ưu điểm của các testcase tổng hợp như chức năng Rosenbrock là có tài liệu hiện có để so sánh, và có một ý nghĩa trong cộng đồng về cách các phương pháp tốt hành xử trên các testcase như vậy. Nếu mọi người sử dụng thử nghiệm riêng của họ, sẽ khó hơn nhiều để đi đến thống nhất phương pháp nào hiệu quả và phương pháp nào không.

— Wolfgang Bangerth
nguồn

1

(Tôi hy vọng không có sự phản đối nào về việc tôi đã kết thúc cuộc thảo luận này. Tôi mới ở đây, vì vậy xin vui lòng cho tôi biết nếu tôi đã vi phạm!)

Các hàm kiểm tra cho các thuật toán tiến hóa bây giờ phức tạp hơn nhiều so với cách đây 2 hoặc 3 năm, như các bộ được sử dụng trong các cuộc thi tại các hội nghị như Đại hội 2015 về tính toán tiến hóa (rất gần đây). Xem:

http://www.cec2015.org/

Các bộ kiểm tra này hiện bao gồm các hàm với một số tương tác phi tuyến tính giữa các biến. Số lượng biến có thể lên tới 1000 và tôi đoán nó có thể tăng trong tương lai gần.

Một cải tiến rất gần đây là "Cuộc thi tối ưu hóa hộp đen". Xem: http://bbcomp.ini.rub.de/

Một thuật toán có thể truy vấn giá trị f (x) cho một điểm x, nhưng nó không thu được thông tin độ dốc và đặc biệt nó không thể đưa ra bất kỳ giả định nào về dạng phân tích của hàm mục tiêu.

Theo một nghĩa nào đó, điều này có thể gần với những gì bạn gọi là "vấn đề thực sự" nhưng trong một môi trường khách quan, có tổ chức.

— Lysistrata
nguồn

1) "không phản đối": ngược lại, các liên kết tốt của bạn đều được chào đón! 2) lô nào tốt không? Các phương pháp và các vấn đề đều bị phá vỡ, do đó, càng ngày càng khó hơn cho bất cứ ai tìm thấy một vấn đề như của họ. Cụ thể, bạn có biết các phương pháp để dự báo chuỗi thời gian không?

— chối

Các chức năng mục tiêu cho Cuộc thi CEC 2015 về Tối ưu hóa đa mục tiêu động có thể được xem tại: sites.google.com.vn/site/cec2015dmoocomp/competition- Process / Khăn Đối với các cuộc thi khác, hãy truy cập cec2015.org và nhấp vào các cuộc thi, sau đó nhấp vào trên các cuộc thi được chấp nhận. Mỗi người có một chức năng riêng. Giấy tờ trên một số trong số họ có cốt truyện đáng yêu (đối với các trường hợp 2D). Các cuộc thi hội nghị GECCO có thể được tìm thấy tại: sigevo.org/gecco-2015/competitions.html#bbc Kết quả sẽ có sau ngày 15 tháng 7

— Lysistrata

0

Bạn có thể có tốt nhất của cả hai thế giới. NIST có một tập hợp các vấn đề cho minimizers, giống như phù hợp này 10 độ polinomial , với kết quả mong đợi và không chắc chắn. Tất nhiên, việc chứng minh rằng các giá trị này là giải pháp tốt nhất thực tế, hoặc sự tồn tại và tính chất của các cực tiểu cục bộ khác khó khăn hơn so với biểu thức toán học có kiểm soát.

— Davidmh
nguồn

Vâng, các vấn đề NIST là nhỏ (2 3 1 1 11 7 6 6 6 6 6 params). Có bộ kiểm tra nào là "thực" và có thể tái tạo , cho bất kỳ góc nào của "thực" không? Cf. một yêu cầu cho mô phỏng dựa trên Tối ưu hóa vấn đề

— denis