Tối ưu hóa khi chức năng chi phí chậm để đánh giá


59

Gradient giảm dần và nhiều phương thức khác hữu ích cho việc tìm cực tiểu cục bộ trong các hàm chi phí. Chúng có thể hiệu quả khi hàm chi phí có thể được đánh giá nhanh chóng tại mỗi điểm, cho dù bằng số hay phân tích.

Tôi có những gì dường như là một tình huống bất thường. Mỗi đánh giá về chức năng chi phí của tôi là đắt tiền. Tôi đang cố gắng tìm một tập hợp các tham số thu nhỏ bề mặt 3D so với bề mặt thật. Bất cứ khi nào tôi thay đổi một tham số, tôi cần chạy thuật toán đối với toàn bộ đoàn hệ thống mẫu để đo lường hiệu quả của nó. Để tính toán độ dốc, tôi cần thay đổi tất cả 15 tham số một cách độc lập, nghĩa là tôi phải tạo lại tất cả các bề mặt và so sánh với cách phối hợp mẫu quá nhiều lần trên mỗi độ dốc và chắc chắn là quá nhiều lần trong quá trình tối ưu hóa.

Tôi đã phát triển một phương pháp để khắc phục vấn đề này và hiện đang đánh giá nó, nhưng tôi ngạc nhiên rằng tôi không tìm thấy nhiều trong tài liệu liên quan đến việc đánh giá chức năng tốn kém. Điều này khiến tôi tự hỏi liệu tôi có đang làm cho vấn đề trở nên khó khăn hơn không và có thể có một cách tốt hơn đã có sẵn.

Vì vậy, câu hỏi của tôi về cơ bản là: Có ai biết phương pháp tối ưu hóa các hàm chi phí, lồi hay không, khi đánh giá chậm? Hoặc, có phải tôi đang làm điều gì đó ngớ ngẩn ngay từ đầu bằng cách chạy lại thuật toán và so sánh với nhóm mẫu rất nhiều lần?


5
Bạn đã nghe nói về độ dốc dốc ngẫu nhiên? Đối với các mạng nơ ron sâu áp dụng cho các Tập huấn luyện lớn, bạn có một vấn đề tương tự (nhưng có thể phân tích độ dốc Eval) và giải pháp chuẩn là tạo độ dốc chỉ dựa trên một mẫu duy nhất (ngẫu nhiên) so với toàn bộ đoàn hệ (đợt)
seanv507

3
Tôi chỉ quen thuộc với khu vực này, vì vậy đây là một nhận xét chứ không phải là một câu trả lời. Nhưng những gì bạn đang thảo luận nghe có vẻ rất nhiều như chủ đề của sự không chắc chắn Định lượng, thường xuyên phải đối mặt bởi các kỹ sư, nơi một đánh giá duy nhất của hàm mục tiêu được thực hiện tuần mất để đánh giá (ít nhất là trong những vướng mắc cho đồng nghiệp kỹ thuật của tôi). Hiểu biết rất hạn chế của tôi về cách xử lý này là bằng cách đưa ra một xấp xỉ thay thế dễ dàng hơn để đánh giá dựa trên các đánh giá trước đây và các mô hình kỹ thuật đơn giản hơn và sau đó sử dụng các mô hình thay thế này để chọn đánh giá tiếp theo ...
Cliff AB

2
... của chức năng mục tiêu đắt tiền hơn. Tôi ghét phải nói nó, nhưng tôi không biết gì về chủ đề này vào lúc này; Tôi chỉ được nói ngắn gọn về nó trong khi thảo luận về các chủ đề nghiên cứu với các kỹ sư nói. Thật thú vị, nó có vẻ như là một lĩnh vực nghiên cứu đầy thách thức: Tôi tin rằng các mô hình tốt đòi hỏi cả sự hiểu biết tốt về vật lý thống kê.
Vách đá AB

1
@ seanv507 Vâng, cảm ơn, nhưng tôi đã tránh nó vì một lý do tương tự. Mất khoảng 30 giây đến một phút để chạy một mẫu. Nếu tôi có 15 tham số, tôi đang xem xét gần 8 phút cho mỗi phép tính độ dốc ngay cả khi tôi chỉ sử dụng một mẫu. Nếu không gian rộng, có thể mất nhiều thời gian. Hãy sửa cho tôi nếu bạn có ý tưởng khác trong đầu.
Jared Becksfort

5
"những gì dường như là một tình huống bất thường. Mỗi đánh giá về chức năng chi phí của tôi đều đắt đỏ." Nói chung, đây không phải là một tình huống bất thường. Nó xuất hiện ở mọi nơi, ví dụ như bao giờ chức năng chi phí của bạn đến từ việc chạy mô phỏng (Ví dụ trong bài viết này: white.ucc.asn.au/publications/White2015PsoTransistorSizing.pdf chúng tôi mô phỏng một mạch trong SPICE mất 10 giây). Hơn nữa, trong khoa học thực nghiệm, việc đánh giá có thể mất nhiều thời gian. Một trong những dự án Masters của bạn tôi về cơ bản là tối ưu hóa 5 thông số để tìm ra cách chèn DNA tốt nhất. Mỗi đánh giá mất 24 giờ.
Lyndon White

Câu trả lời:


59

TL; DR

Tôi khuyên bạn nên sử dụng LIPO. Nó hoàn toàn chính xác và có thể chứng minh tốt hơn tìm kiếm ngẫu nhiên thuần túy (PRS). Nó cũng cực kỳ đơn giản để thực hiện, và không có siêu âm. Tôi chưa tiến hành phân tích so sánh LIPO với BO, nhưng kỳ vọng của tôi là sự đơn giản và hiệu quả của LIPO ngụ ý rằng nó sẽ vượt trội so với BO.

(Xem thêm: một số sự biến mất của tối ưu hóa tham số siêu bayes là gì? )

Tối ưu hóa Bayes

Các phương thức tối ưu hóa Bayes xây dựng các mô hình thay thế quy trình Gaussian để khám phá không gian tham số. Ý tưởng chính là các bộ tham số gần nhau hơn sẽ có các giá trị hàm tương tự nhau, do đó, giả định về cấu trúc đồng phương giữa các điểm cho phép thuật toán đưa ra dự đoán có giáo dục về bộ dữ liệu tham số tốt nhất nào đáng để thử tiếp theo. Chiến lược này giúp giảm số lượng đánh giá chức năng; trong thực tế, động lực của các phương pháp BO là giữ cho số lượng đánh giá chức năng càng thấp càng tốt trong khi "sử dụng toàn bộ con trâu" để đưa ra dự đoán tốt về điểm cần kiểm tra tiếp theo. Có nhiều số liệu khác nhau (cải thiện dự kiến, cải thiện lượng tử dự kiến, xác suất cải thiện ...) được sử dụng để so sánh các điểm cần truy cập tiếp theo.

Đối chiếu điều này với một cái gì đó giống như tìm kiếm dạng lưới, sẽ không bao giờ sử dụng bất kỳ thông tin nào từ các đánh giá chức năng trước đó để thông báo nơi sẽ đi tiếp theo.

Ngẫu nhiên, đây cũng là một kỹ thuật tối ưu hóa toàn cầu mạnh mẽ , và do đó không đưa ra giả định nào về độ lồi của bề mặt. Ngoài ra, nếu chức năng là ngẫu nhiên (giả sử, các đánh giá có một số nhiễu ngẫu nhiên cố hữu), điều này có thể được tính trực tiếp trong mô hình GP.

Mặt khác, bạn sẽ phải phù hợp với ít nhất một GP ở mỗi lần lặp (hoặc một vài lần, chọn "tốt nhất" hoặc lấy trung bình trên các phương án thay thế hoặc phương pháp Bayes hoàn toàn). Sau đó, mô hình được sử dụng để đưa ra (có thể hàng ngàn) dự đoán, thường ở dạng tối ưu hóa cục bộ đa cấp, với quan sát rằng việc đánh giá chức năng dự đoán GP rẻ hơn nhiều so với chức năng được tối ưu hóa. Nhưng ngay cả với chi phí tính toán này, nó có xu hướng là trường hợp ngay cả các hàm nonconvex có thể được tối ưu hóa với số lượng cuộc gọi hàm tương đối nhỏ.

Một bài báo được trích dẫn rộng rãi về chủ đề này là Jones et al , "Tối ưu hóa toàn cầu hiệu quả các chức năng hộp đen đắt tiền". Nhưng có nhiều biến thể về ý tưởng này.

Tìm kiếm ngẫu nhiên

p q

q=0.95p=0.95100×(1q)=5nqn=0.95n10.95n. Đặt tất cả lại với nhau, chúng ta có

1qnpnlog(1p)log(q)

n59

n=60n=60

Vì bạn có một sự đảm bảo xác suất về kết quả tốt như thế nào, nó có thể là một công cụ thuyết phục để thuyết phục sếp của bạn rằng không cần thiết phải chạy thêm các thử nghiệm.

LIPO và các biến thể của nó

Đây là một điểm đến thú vị mà nếu nó không mới , chắc chắn là mới đối với tôi. Nó tiến hành bằng cách xen kẽ giữa việc đặt các giới hạn được thông báo trên hàm và lấy mẫu từ giới hạn tốt nhất và sử dụng các xấp xỉ bậc hai. Tôi vẫn đang làm việc thông qua tất cả các chi tiết, nhưng tôi nghĩ điều này rất hứa hẹn. Đây là một bài viết trên blog rất hay và bài báo là Cédric Malherbe và Nicolas Vayatis " Tối ưu hóa toàn cầu các chức năng của Lipschitz ".


1
Đây có vẻ như là một biến thể hiện đại của phương pháp phản ứng bề mặt!
kjetil b halvorsen

1
Trên thực tế, tìm kiếm ngẫu nhiên có thể hoạt động rất tốt: argmin.net/2016/06/20/hypertuning
Tim

1
@Tim Vâng, quan điểm của bạn được thực hiện tốt. Tôi không muốn "quyết định" vấn đề nào tốt hơn trong bài này, vì về cơ bản có những hoán vị vô tận trên BO, mỗi cái đều tự nhận là "trình tối ưu hóa hộp đen" tốt nhất - khiến nó không thể dứt khoát. Tôi đồng ý rằng tìm kiếm ngẫu nhiên có thể hoạt động khá tốt, nhưng tôi thực sự muốn giới thiệu LIPO qua PRS. LIPO có thể chứng minh chính xác và thực hiện mạnh mẽ PRS (trung bình) trong tất cả các thử nghiệm của tôi. LIPO cũng có chi phí ước tính tối thiểu: nếu bạn có thể giảm thiểu QP, thì bạn có thể sử dụng LIPO và LIPO có siêu đường kính bằng không (ngược lại với BO).
Phục hồi Monica

Tôi vui vì tôi đã kiểm tra câu hỏi này một lần nữa. LIPO có vẻ tuyệt vời.
Jared Becksfort

LIPO thật tuyệt. Khi tôi có một khoảnh khắc tôi sẽ mở rộng câu trả lời của mình để đưa ra một kế toán tốt hơn về LIPO.
Phục hồi lại

40

f(x)x

Tôi muốn nói rằng tiêu chuẩn vàng hiện tại để đánh giá (rất) chức năng hộp đen tốn kém là (toàn cầu) tối ưu hóa Bayes (BO). Sycorax đã mô tả một số tính năng của BO, vì vậy tôi chỉ thêm một số thông tin có thể hữu ích.

Là một điểm khởi đầu, bạn có thể muốn đọc bài viết tổng quan này 1 . Ngoài ra còn có một cái gần đây hơn [2].

Tối ưu hóa Bayes đã phát triển ổn định như một lĩnh vực trong những năm gần đây, với một loạt các hội thảo chuyên dụng (ví dụ BayesOpt , và xem các video này từ hội thảo của Sheffield về BO), vì nó có các ứng dụng rất thực tế trong học máy, như để tối ưu hóa siêu tham số của thuật toán ML - xem ví dụ: bài báo này [3] và hộp công cụ liên quan, SpearMint . Có nhiều gói khác trong các ngôn ngữ khác nhau thực hiện các loại thuật toán tối ưu hóa Bayes khác nhau.

Như tôi đã đề cập, yêu cầu cơ bản là mỗi đánh giá chức năng rất tốn kém, do đó các tính toán liên quan đến BO thêm một chi phí không đáng kể. Để cung cấp một sân bóng, BO có thể rất hữu ích nếu chức năng của bạn đánh giá trong một khoảng thời gian theo thứ tự vài phút trở lên. Bạn cũng có thể áp dụng nó cho các tính toán nhanh hơn (ví dụ hàng chục giây), nhưng tùy thuộc vào thuật toán bạn sử dụng, bạn có thể phải áp dụng các xấp xỉ khác nhau. Nếu chức năng của bạn đánh giá theo thang thời gian của giây , tôi nghĩ rằng bạn đang vượt qua ranh giới của nghiên cứu hiện tại và có lẽ các phương pháp khác có thể trở nên hữu ích hơn. Ngoài ra, tôi phải nói rằng, BO hiếm khi thực sự là hộp đen và bạn thường phải điều chỉnh các thuật toán, đôi khi rất nhiều , để làm cho nó hoạt động hết tiềm năng với một vấn đề thực tế cụ thể.

Bỏ qua một bên, để đánh giá các phương pháp tối ưu hóa không có đạo hàm chung, bạn có thể xem xét đánh giá này [4] và kiểm tra các thuật toán có đặc tính tốt của sự hội tụ nhanh. Ví dụ: Tìm kiếm phối hợp đa cấp (MCS) thường hội tụ rất nhanh đến một vùng lân cận tối thiểu (tất nhiên không phải luôn luôn là mức tối thiểu toàn cầu). MCS được cho là tối ưu hóa toàn cầu, nhưng bạn có thể biến nó thành cục bộ bằng cách đặt các ràng buộc ràng buộc thích hợp.

Cuối cùng, bạn quan tâm đến BO cho các chức năng mục tiêu vừa tốn kém vừa ồn ào , hãy xem câu trả lời của tôi cho câu hỏi này .


Người giới thiệu:

1 Brochu và cộng sự, "Hướng dẫn về Tối ưu hóa Bayes cho các hàm chi phí đắt đỏ, với ứng dụng cho mô hình hóa người dùng tích cực và học tập củng cố phân cấp" (2010).

[2] Shahriari và cộng sự, "Đưa con người ra khỏi vòng lặp: Đánh giá về tối ưu hóa Bayes" (2015).

[3] Snoek và cộng sự, "Tối ưu hóa thực tế của thuật toán học máy", NIPS (2012).

[4] Rios và Sahinidis, "Tối ưu hóa miễn phí phái sinh: đánh giá các thuật toán và so sánh việc triển khai phần mềm", Tạp chí Tối ưu hóa toàn cầu (2013).


4
+1 Đây là một câu trả lời tuyệt vời. Đặc biệt, những giấy tờ này là một bổ sung tuyệt vời cho chủ đề này; thật vậy, tôi không biết rằng phương pháp chung mà tôi đã mô tả được gọi là Tối ưu hóa Bayes. Nhưng tôi lo ngại rằng các liên kết có thể xấu đi theo thời gian. Bạn có phiền khi thêm thông tin trích dẫn đầy đủ hơn để người dùng trong tương lai có thể truy cập các giấy tờ này không?
Phục hồi lại

Các giấy tờ tối ưu hóa Bayes là khá hữu ích. Cảm ơn vì đã trả lời.
Jared Becksfort

1
@ user777: Điểm tốt. Đã thêm một danh sách tham chiếu rõ ràng ở cuối, đủ để phục hồi các giấy tờ.
lacerbi

6

Bản thân tôi không biết các thuật toán, nhưng tôi tin rằng loại thuật toán tối ưu hóa mà bạn đang tìm kiếm là tối ưu hóa khôngđạo hàm , được sử dụng khi mục tiêu tốn kém hoặc ồn ào .

Ví dụ, hãy xem bài viết này (Bjorkman, M. & Holmström, K. "Tối ưu hóa toàn cầu các chức năng không liên quan tốn kém bằng cách sử dụng các chức năng cơ sở xuyên tâm." Tối ưu hóa và kỹ thuật (2000) 1: 373. doi: 10.1023 / A: 1011584207202) có vẻ trừu tượng cho thấy đây là chính xác những gì bạn muốn:

Bài viết xem xét tối ưu hóa toàn cầu các hàm mục tiêu tốn kém, tức là vấn đề tìm mức tối thiểu toàn cầu khi có một số cực tiểu cục bộ và mỗi giá trị hàm cần thời gian CPU đáng kể để tính toán. Những vấn đề như vậy thường phát sinh trong các ứng dụng công nghiệp và tài chính, trong đó giá trị chức năng có thể là kết quả của việc mô phỏng hoặc tối ưu hóa máy tính tốn thời gian. Các công cụ phái sinh thường khó lấy nhất và các thuật toán được trình bày không sử dụng thông tin đó.


2
Vui lòng bao gồm thông tin trích dẫn đầy đủ cho các giấy tờ được liên kết và các tài nguyên khác. Chúng tôi muốn xây dựng một kho thông tin lâu bền và các liên kết có xu hướng xấu đi theo thời gian.
Phục hồi lại

Bjorkman, M. & Holmström, K. "Tối ưu hóa toàn cầu các chức năng không liên quan tốn kém bằng cách sử dụng các chức năng cơ sở xuyên tâm." Tối ưu hóa và Kỹ thuật (2000) 1: 373. doi: 10.1023 / A: 1011584207202
jkdev

4

Bạn không cô đơn.

Các hệ thống đánh giá đắt tiền rất phổ biến trong kỹ thuật, chẳng hạn như mô hình phương pháp phần tử hữu hạn (FEM) và mô hình động lực học chất lỏng tính toán (CFD). Tối ưu hóa các mô hình đắt tiền tính toán này là rất cần thiết và thách thức bởi vì các thuật toán tiến hóa thường cần hàng chục nghìn đánh giá về vấn đề không phải là một lựa chọn cho các vấn đề tốn kém để đánh giá. May mắn thay, có rất nhiều phương pháp (thuật toán) có sẵn để giải quyết vấn đề này. Theo tôi biết, hầu hết trong số họ dựa trên các mô hình thay thế (metamodels). Một số được liệt kê dưới đây.

  • Tối ưu hóa toàn cầu hiệu quả (EGO) [1]. Thuật toán EGO đã được đề cập ở trên và có thể là thuật toán tối ưu hóa dựa trên thay thế nổi tiếng nhất. Nó dựa trên mô hình Kriging và một tiêu chí điền vào được gọi là chức năng cải tiến dự kiến ​​(EI). Các gói R bao gồm thuật toán EGO là DiceOptim và DiceKriging.
  • Phương pháp lấy mẫu theo đuổi chế độ (MPS) [2]. Thuật toán MPS được xây dựng trên mô hình RBF và chiến lược lấy mẫu hấp dẫn được sử dụng để chọn điểm ứng viên. Mã MATLAB được xuất bản bởi các tác giả tại http://www.sfu.ca/~gwa5/software.html . Thuật toán MPS có thể cần nhiều đánh giá hơn để có được mức tối ưu, nhưng có thể xử lý các vấn đề phức tạp hơn so với thuật toán EGO từ kinh nghiệm cá nhân của tôi.
  • Đồng phục thay thế các mô hình của Juliane Müller [3]. Cô đã sử dụng nhiều chất thay thế để tăng cường khả năng tìm kiếm. Hộp công cụ MATLAB MATSuMoTo có sẵn tại https://github.com/Piiloblondie/MATSuMoTo .

Tóm lại, các thuật toán tối ưu hóa dựa trên thay thế này cố gắng tìm ra tối ưu toàn cầu của vấn đề bằng cách sử dụng càng ít đánh giá càng tốt. Điều này đạt được bằng cách sử dụng đầy đủ các thông tin mà người thay thế (người thay thế) cung cấp. Đánh giá về tối ưu hóa các vấn đề đắt tiền có tính toán nằm trong [4-6].


Tài liệu tham khảo:

  1. DR Jones, M. Schonlau và WJ Welch, "Tối ưu hóa toàn cầu hiệu quả các chức năng hộp đen đắt tiền", Tạp chí Tối ưu hóa toàn cầu, tập. 13, tr. 455-492, 1998.
  2. L. Wang, S. Shan và GG Wang, "Phương pháp lấy mẫu theo đuổi chế độ để tối ưu hóa toàn cầu đối với các chức năng hộp đen đắt tiền," Engineering Optimization, tập. 36, trang 419-438, 2004.
  3. J. Müller, "Thuật toán mô hình thay thế cho các vấn đề tối ưu hóa toàn cầu hộp đen đắt tiền," Đại học Công nghệ Tampere, 2012.
  4. GG Wang và S. Shan, "Đánh giá các kỹ thuật siêu mô hình hỗ trợ tối ưu hóa thiết kế kỹ thuật", Tạp chí Thiết kế Cơ khí, tập. 129, trang 370-380, 2007.
  5. AI Forrester và AJ Keane, "Những tiến bộ gần đây trong tối ưu hóa dựa trên thay thế", Tiến bộ trong Khoa học hàng không vũ trụ, tập. 45, trang 50-79, 2009.
  6. FAC Viana, TW Simpson, V. Balabanov và V. Toropov, "Siêu mô hình trong tối ưu hóa thiết kế đa ngành: Chúng ta thực sự đã đi được bao xa?," Tạp chí AIAA, tập. 52, trang 670-690, 2014/04/01 2014.

3

Hai chiến lược đơn giản mà tôi đã sử dụng thành công trong quá khứ là:

  1. Nếu có thể, hãy thử tìm một hàm thay thế đơn giản hơn xấp xỉ đánh giá hàm chi phí đầy đủ của bạn - điển hình là một mô hình phân tích thay thế một mô phỏng. Tối ưu hóa chức năng đơn giản hơn này. Sau đó xác nhận và tinh chỉnh giải pháp kết quả với hàm chi phí chính xác của bạn.
  2. Nếu có thể, hãy cố gắng tìm ra cách để đánh giá một chính xác "đồng bằng chi phí" chức năng - chính xác như trái ngược là một xấp xỉ từ việc sử dụng gradient. Đó là, từ điểm 15 chiều ban đầu mà bạn đã đánh giá toàn bộ chi phí, hãy tìm cách rút ra cách chi phí sẽ thay đổi bằng cách thực hiện một thay đổi nhỏ thành một (hoặc một vài) trong số 15 thành phần của điểm hiện tại của bạn. Bạn sẽ cần khai thác các thuộc tính nội địa hóa của một nhiễu loạn nhỏ nếu có trong trường hợp cụ thể của bạn và bạn có thể sẽ cần xác định, lưu trữ bộ đệm và cập nhật một biến trạng thái nội bộ trên đường đi.

Những chiến lược đó rất cụ thể, tôi không biết liệu chúng có thể được áp dụng trong trường hợp của bạn hay không, xin lỗi nếu không. Cả hai đều có thể được áp dụng (như trong các trường hợp sử dụng của tôi): áp dụng chiến lược "chi phí delta" cho một mô hình phân tích đơn giản hơn - hiệu suất có thể được cải thiện theo một số bậc độ lớn.

Một chiến lược khác sẽ là sử dụng một phương pháp bậc hai thường có xu hướng giảm số lần lặp (nhưng mỗi lần lặp lại phức tạp hơn) - ví dụ: thuật toán Levenberg Thẻ Marquest . Nhưng xem xét bạn dường như không có cách nào để đánh giá trực tiếp và hiệu quả độ dốc, đây có lẽ không phải là một lựa chọn khả thi trong trường hợp này.


3

Như những người khác đã đề cập, một mô hình thay thế (còn gọi là bề mặt phản hồi) là một cách tiếp cận mạnh mẽ. Theo tôi, một điều cốt yếu mà mọi người quên là bạn có thể thực hiện song song một số đánh giá chức năng , nếu sử dụng CPU đa lõi.

Tôi khuyên bạn nên xem mã này , nó sử dụng mô hình phản hồi đơn giản, nhưng tỷ lệ trên các CPU đa lõi, giúp tăng tốc độ bằng với số lượng lõi được sử dụng. Một toán học đằng sau phương pháp được mô tả trong bài báo này .


Tôi giả sử bạn là tác giả đầu tiên trên báo - có lẽ bạn nên đề cập rằng nếu đó là trường hợp. Bài viết thiếu so sánh với các phương pháp tiên tiến như tối ưu hóa Bayes hoặc các phương pháp thay thế khác (thực tế, nó không cung cấp bất kỳ điểm chuẩn nào cả). Bạn có thể nói gì thêm không?
lacerbi

Tôi không nói rằng mô hình được sử dụng ở đó là tốt hơn. Tôi chỉ nói rằng mọi người quá quan tâm đến chất lượng của mô hình và đôi khi quên đi sự song song, điều này có thể là vấn đề lớn khi có nhiều lõi tham gia ..
Paul

Vui lòng bao gồm thông tin trích dẫn đầy đủ cho các giấy tờ được liên kết và các tài nguyên khác. Chúng tôi muốn xây dựng một kho thông tin lâu bền và các liên kết có xu hướng xấu đi theo thời gian.
Phục hồi lại

2
Tôi không chắc có bao nhiêu thuật ngữ khác nhau tùy theo cộng đồng, nhưng tôi thường ở đây phản ứng bề mặt được sử dụng như một từ đồng nghĩa với "mô hình thay thế đa thức" (thường là một bậc hai). Vì vậy, tôi có xu hướng nghĩ về mô hình thay thế như là một siêu mô hình của phản ứng bề mặt. (Tuy nhiên, điều này có thể không chính xác.)
GeoMatt22

0

Có nhiều thủ thuật được sử dụng trong việc giảm độ dốc ngẫu nhiên cũng có thể được áp dụng để đánh giá hàm mục tiêu. Ý tưởng tổng thể đang cố gắng xấp xỉ hàm mục tiêu bằng cách sử dụng tập hợp con của dữ liệu .

Câu trả lời của tôi trong hai bài viết này thảo luận về lý do tại sao độ dốc dốc ngẫu nhiên hoạt động: trực giác đằng sau nó là để xấp xỉ độ dốc bằng cách sử dụng một tập hợp con của dữ liệu.

Làm thế nào để giảm độ dốc ngẫu nhiên có thể tiết kiệm thời gian so với độ dốc gốc tiêu chuẩn?

Làm cách nào để chạy hồi quy tuyến tính theo cách song song / phân tán cho cài đặt dữ liệu lớn?

Thủ thuật tương tự áp dụng cho hàm mục tiêu.

Axb2AAb

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.