Hối hận nội bộ trong Tối ưu hóa lồi trực tuyến


19

"Tối ưu hóa lồi trực tuyến" của Zinkevich ( http://www.cs.cmu.edu/~maz/publications/ICML03.pdf ) khái quát các thuật toán học "tối thiểu hóa hối tiếc" từ cài đặt tuyến tính sang cài đặt lồi và "hối tiếc bên ngoài" tốt . Có một khái quát tương tự cho hối tiếc nội bộ? (Tôi không hoàn toàn chắc chắn chính xác điều đó có nghĩa là gì.)


Có thể thêm một mô tả ngắn về hối tiếc nội bộ cho câu hỏi?
Moritz

Trong các "chuyên gia" thông thường, việc hối tiếc nội bộ sẽ có nghĩa là khi nhìn lại, bạn sẽ không muốn chuyển một hành động này sang hành động khác, nhất quán trong toàn bộ lịch sử. Bài báo Blum-Mansour có lẽ là tài liệu tham khảo tốt nhất cho sự hối tiếc bên trong so với bên ngoài: jmlr.csail.mit.edu/ con / volume8 / blum07a / blum07a.pdf
Noam

Câu trả lời:


9

Hãy thử "Không hối tiếc khi học trong các trò chơi lồi" của Gordon, Greenwald và Marks http://portal.acm.org/citation.cfm?id=1390202 . Âm thanh trừu tượng của nó có thể trả lời câu hỏi của bạn hoặc ít nhất bất cứ ai trả lời câu hỏi đó sẽ trích dẫn hoặc được trích dẫn bởi bài báo đó.


0

Bài viết Avrim Blum này chỉ ra mối liên hệ giữa sự hối tiếc bên ngoài và bên trong. Theo tóm tắt của nó, externa regret là thước đo mức độ tệ của thuật toán so với hành động cố định tốt nhất, trong khi hối tiếc bên trong so sánh với biến thể tốt nhất của phương thức đó (hoán vị cố định tốt nhất của đầu ra, như báo cáo lớp A bất cứ khi nào thuật toán ban đầu báo cáo lớp B).


1
Bài báo Blum-Mansour không nằm trong cài đặt "tối ưu hóa lồi trực tuyến", mà là trong cài đặt "chuyên gia" tuyến tính. Câu hỏi của tôi là liệu một cái gì đó tương tự, hoặc một số thuật toán hối tiếc nội bộ trực tiếp khác có thể được áp dụng trong cài đặt lồi.
Noam
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.