Dường như có hai loại chức năng thử nghiệm chính cho tối ưu hóa không phái sinh:
- một lớp lót như hàm Rosenbrock ff., với điểm bắt đầu
- tập hợp các điểm dữ liệu thực, với bộ nội suy
Có thể so sánh nói 10d Rosenbrock với bất kỳ vấn đề 10d thực sự nào không?
Người ta có thể so sánh theo nhiều cách khác nhau: mô tả cấu trúc của cực tiểu cục bộ
hoặc chạy tối ưu hóa ABC trên Rosenbrock và về một số vấn đề thực tế;
nhưng cả hai điều này có vẻ khó khăn
(Có lẽ các nhà lý thuyết và thí nghiệm chỉ là hai nền văn hóa khá khác nhau, vì vậy tôi đang yêu cầu một con chimera?)
Xem thêm:
- scicomp.SE câu hỏi: Trường hợp nào người ta có thể có được các tập dữ liệu / vấn đề kiểm tra tốt để kiểm tra các thuật toán / thói quen?
- Hooker, "Kiểm tra Heuristic: We Have It All Wrong" thật đáng sợ: "sự nhấn mạnh vào cạnh tranh ... cho chúng ta biết thuật toán nào tốt hơn nhưng không phải tại sao."
(Added trong tháng 9 năm 2014):
Cốt truyện dưới đây so sánh 3 thuật toán DFO trên 14 chức năng thử nghiệm trong 8d từ 10 điểm bắt đầu ngẫu nhiên: BOBYQA Praxis SBPLX từ NLOpt chức năng kiểm tra 14 N-chiều, Python dưới gist.github từ này Matlab bởi A . Hedar 10 điểm bắt đầu ngẫu nhiên thống nhất trong hộp giới hạn của mỗi chức năng.
Trên Ackley, ví dụ, hàng trên cùng cho thấy SBPLX là tốt nhất và PRAXIS khủng khiếp; trên Schwefel, bảng dưới cùng bên phải hiển thị SBPLX tìm tối thiểu trên điểm bắt đầu ngẫu nhiên thứ 5.
Nhìn chung, BOBYQA là tốt nhất trên 1, PRAXIS trên 5 và SBPLX (~ Nelder-Mead với khởi động lại) trên 7 trong số 13 chức năng kiểm tra, với Powersum một lần tung. YMMV! Cụ thể, Johnson nói: "Tôi sẽ khuyên bạn không nên sử dụng hàm-giá trị (ftol) hoặc dung sai tham số (xtol) trong tối ưu hóa toàn cầu."
Kết luận: không đặt tất cả tiền của bạn vào một con ngựa hoặc trên một chức năng kiểm tra.