Cạnh tranh với đa số trọng số tối ưu trong thuật toán chuyên gia


8

Trong vấn đề chuyên gia, chuyên gia cung cấp cho bạn dự đoán nhị phân hàng ngày và bạn phải dự đoán liệu trời sẽ mưa vào ngày mai.n

Đó là, vào ngày , bạn biết các dự đoán trong quá khứ của các chuyên gia, thời tiết thực tế cho các ngày và các dự đoán cho ngày mai và phải dự đoán liệu trời sẽ mưa vào ngày hôm sau.1 , 2 , ... tt1,2,Giáo dụct

Trong thuật toán Đa số trọng số cổ điển , thuật toán này mắc lỗi , trong đó là số lỗi của chuyên gia giỏi nhất.mÔi(đăng nhậpn+m)m

Đối với tôi, đây dường như là một lời hứa cực kỳ yếu, vì nó không cho phép bất kỳ lợi ích nào từ việc kết hợp dự đoán của một số chuyên gia.

Giả sử rằng mỗi kết quả là , dự đoán của chuyên gia i vào ngày tp i , t và kết quả của ngày to t . Chúng ta có thể xác định một 'tối ưu trọng lớn '' kẻ thù' như một chức năng cân tối ưu w delta ( [ n ] ) , như vậy mà quyết định của kẻ thù vào ngày t được định nghĩa là s i g n ( w p t ){±1}TôitpTôi,ttotwΔ([n])tSTôign(wpt), tức là phần lớn trọng số của các dự đoán, liên quan đến vectơ w . Sử dụng ký hiệu này, đối thủ trước đó (chuyên gia giỏi nhất) chỉ có thể chọn các vectơ đơn vị.

1,2,Giáo dụcT

E= =12tối thiểuwΔ([n])Σt= =1T|STôign(wpt)-ot|

Làm thế nào bạn sẽ giảm thiểu sự hối tiếc, so với E ?


Để thấy rằng đây là một đối thủ mạnh hơn nhiều, hãy xem xét trường hợp của chuyên gia và ngày trong đó kết quả luôn là . Nếu , thì mỗi chuyên gia có một lỗi, nhưng vectơ đa số có trọng số là không có.3 1 p 1 = ( 1 , 1 , - 1 ) , p 2 = ( 1 , - 1 , 1 ) , p 3 = ( - 1 , 1 , 1 ) ( 1 / 3 , 1 / 3 , 1 / 3 )331p1=(1,1,1),p2=(1,1,1),p3=(1,1,1)(1/3,1/3,1/3)


1
Tôi nghĩ rằng bạn đang tìm kiếm phương pháp Exponentiated Gradient: users.soe.ucsc.edu/~manfred/pubs/J36.pdf
Lev Reyzin

Trọng số nhân có lỗi so với chuyên gia duy nhất tốt nhất (trong số ) qua các vòngChúng tôi có thể tạo "chuyên gia meta" tương ứng với tất cả các đa số có thể có trọng số và sau đó chạy MW để gặp lỗi . Không chắc lớn đến mức nào - có lẽ đủ. nO(Tđăng nhậpn)nN O ( TNNN=n O ( n )Ôi(Tđăng nhậpN)NN=nO(n)
Thomas

@Thomas - nghĩ về nó một lúc trước. Bạn sẽ phải đặt , khá lớn: oeis.org/A000609 . N=nΘ(n2)
RB

O(nTlogn)Lỗi là một khởi đầu tốt. Bạn đang nhắm đến cái gì?
Thomas

@Thomas - đó thực sự là một sự khởi đầu. Tôi đã hy vọng cho một thuật toán và tin rằng nó sẽ khả thi. o(nT)
RB

Câu trả lời:


1

Nếu bạn không ngại ngẫu nhiên, thì các thuật toán học trực tuyến tiêu chuẩn trong "khung tối ưu hóa lồi trực tuyến" sẽ cung cấp cho bạn về cơ bản những gì bạn yêu cầu, theo mong đợi. Lý do là các thuật toán này được yêu cầu để tạo ra một phân phối cho các chuyên gia ở mỗi bước, chịu tổn thất dự kiến ​​bằng với kỳ vọng chọn một chuyên gia từ phân phối này. Và họ có sự hối tiếc mong đợi thấp so với phân phối tốt nhất trên các chuyên gia, tức là .O ( wΔ([n])Ôi(lnn/T)

Ví dụ: bạn có thể sử dụng thuật toán trọng số nhân cổ điển, chỉ chiếm đa số trọng số nhưng chọn một chuyên gia để theo dõi với xác suất tỷ lệ thuận với "trọng số" của nó. Điều này được đề cập trong khảo sát của Arora (Định lý 6): https://www.cs.princeton.edu/~arora/pub/MWsurvey.pdf


2
Usul, khi bạn nói "hối tiếc so với phân phối tốt nhất trên các chuyên gia", đó có phải là những gì RB đang yêu cầu? Không phải là cách tiêu chuẩn để sử dụng phân phối cho các chuyên gia để chỉ dự đoán phân đoạn mỗi lần ? Hoặc (nhiều hơn hoặc ít hơn tương đương) để dự đoán 1 với xác suất và -1 nếu không. Sau đó, luôn luôn có một tối ưu chỉ sử dụng một chuyên gia, phải không? Nhưng theo tôi hiểu đề xuất của RB, thì hơi khác một chút: đưa ra dự đoán số nguyên: dấu tại mỗi thời điểm . Có rõ ràng điều này không thể đưa ra dự đoán tốt hơn đáng kể? w p t t ( w p t + 1 ) / 2 w ( w p t ) twwptt(wpt+1)/2w(wpt)t
Neal Young

@NealYoung, điểm tốt, tôi đã không nghĩ về điều đó sâu sắc. Tôi mặc nhiên cho rằng bạn có thể lồi lên chức năng khách quan này và nhận được sự hối tiếc tốt cho nó, nhưng điều đó có thể sai ...
usul
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.