Giá trị của trò chơi này là gì (trò chơi tái cân bằng) là gì?


8

Câu hỏi này đã được đăng trên CS.SE hai tuần trước , nhưng nó không nhận được câu trả lời thỏa mãn.

Giả sử bạn có trò chơi sau:

Có vô số bộ đếm , tất cả được khởi tạo thành 0.{c1,c2,}

Trong mỗi bước, bạn chọn một bộ đếm và tăng giá trị của nó lên 1.ci

Thật không may, mỗi bước , mỗi bộ đếm có giá trị dương bị giảm đi 1.T

Ngoài ra, các giá trị của bộ đếm được giới hạn bởi , vì vậy bạn không thể tăng thêm bộ đếm nữa.M

1. Đưa ra bao nhiêu bước tùy thích, bạn có thể đạt được nhiều quầy có giá trị tích cực không?

2. Có bao nhiêu bộ đếm có giá trị tích cực có thể truy cập được sau bước?TM1


Đối với câu hỏi (1), đây là bản tích hợp chi tiết cho các bộ đếm dương :Tlog(M)

  1. Trong khi bạn có ít hơn bộ đếm ở giá trị : T1M
    • Tăng chỉ số truy cập tối thiểu có giá trị là đúng ít hơn .M

(Điều này phải hội tụ khi tổng của các bộ đếm được ràng buộc để tăng mỗi bước )T

  1. Hãy .r=T

  2. Trong khi ( )c0>1

    a. trong khi ( )c0>cr

    • Tăngcr

    b. r=r+1

Bây giờ để phân tích: quan sát đầu tiên là số lượng các quầy tích cực là .r

Bây giờ hãy để là giá trị tối đa đã đạt được. Với ta được . Với chúng tôi nhận được hoặc nói chungmrcrr=TM(11T)r=T+1mr(11T)=M(11T)2

rT:mr=M(11T)rT+1

Tiếp theo, chúng tôi nhận thấy rằng khi đạt được , . Điều này có nghĩa là vòng lặp sẽ dừng lại khi (đưa ra hoặc thực hiện tính tích hợp và chiến lược cuối trò chơi).mrc0=mrmr<1

Điều này mang lại cho chúng ta

M(11T)rT+1<1
(11T)rT+1<M1
(rT+1)log(11T)<logM
rT+1<logMlog(11T)
r<logMlog(11T)+T1
r<logMk11kTk+T1<T(logM+1)1

Có thể làm tốt hơn? Bất cứ ai có thể chứng minh điều này là tối ưu?

Câu trả lời:


5

Giới hạn dưới cho câu hỏi 2:

Định lý: Sau các bước , với chiến lược được nêu dưới đây, bạn sẽ có ít nhất bộ đếm tích cực.TM1(T1)logM

Ký hiệu: Xác định thời gian bước là bắt đầu các bước và là kết thúc. Sự sụt giảm xảy ra ở bước thời gian , .1TM1TM1Tk1k<M

Xác định giới hạn trên là , trong đó là bước thời gian hiện tại. Giới hạn này bắt đầu tại M và giảm dần mỗi khi bộ đếm giảm, kết thúc ở . Giới hạn này được chọn vì nếu nhiều bộ đếm được đặt trên một ô hơn giới hạn trên, chúng sẽ bị lãng phí, vì bộ đếm sẽ có giá trị lớn hơn trên bước .MN/TN11TM1

Chiến lược: Trên mỗi bước thời gian, tăng bộ đếm ngoài cùng bên trái có giá trị nhỏ hơn giới hạn trên.

Ký hiệu: Xác định tầm quan trọng của bộ đếm là , trong đó V là giá trị hiện tại của nó và là giới hạn trên hiện tại.V/ULUL

Bổ đề: Trong mỗi nhóm các bước kết thúc giảm dần, tổng số quan trọng của các bộ đếm tăng ít nhất , trong đó là giới hạn trên hiện tại.T(T1)/ULUL

Bằng chứng bổ đề: Mỗi lần tăng bộ đếm, tầm quan trọng của nó tăng thêm . Khi sự sụt giảm xảy ra, tất cả ngoại trừ một bộ đếm đều ở giới hạn trên và có tầm quan trọng là . Tầm quan trọng của bộ đếm còn lại bị thu hẹp tối đa , vì giá trị của nó giảm đi và không tăng. Do đó, mức tăng và giảm làm tăng tổng mức quan trọng ít nhất . Ngoài ra, trong nhóm gia tăng cuối cùng , trong đó không xảy ra sự sụt giảm nào, tổng số lần nhập khẩu tăng theo .1/ULUL/UL=11/UL1ULT1(T1)/ULT1(T1)/UL

Bằng chứng về định lý: Trong mỗi nhóm các bước kết thúc giảm dần và trong các bước cuối cùng , tổng số lần nhập khẩu tăng ít nhất . Do đó, sau khi bước, tổng của importances sẽ có ít nhất , đó là ít nhất . Vì bước thời gian giới hạn trên là , nên phải có bộ đếm dương tại thời điểm này.TT1(T1)/ULTM1k=1m(T1)/k(T1)logMTM11(T1)logM


5

Đây là một giới hạn trên cho câu hỏi 2.

Định lý: Sau các bước , bạn có thể có tối đa các bộ đếm dươngTMTlogM

Ký hiệu: chúng ta gán từng bước một con số, kết thúc với thứ bước, và bắt đầu với lần thứ bước.0(TM+1)

Quan sát: trong chiến lược tối ưu, nếu bạn tăng bộ đếm, bạn không để nó trở về .0

Bằng chứng: Hãy để chúng tôi gán giá trị cho mỗi lần bạn tăng bộ đếm trong các bước cuối cùng ; cho mỗi lần bạn tăng bộ đếm trong các bước trước đó ; cho mỗi lần bạn tăng bộ đếm trong các bước trước đó, v.v. Nghĩa là, nếu bạn tăng bộ đếm giữa bước và , nó sẽ có một giá trị của . Chúng tôi cần một bổ đề mà chúng tôi sẽ chứng minh sau.1T12T13TkT+1(k1)T1k

Bổ đề: để một bộ đếm là dương, nó phải có tổng giá trị ít nhất là được gán cho nó.1

Với bổ đề, việc chứng minh rất dễ dàng: tổng giá trị chúng ta phải gán là và mỗi bộ đếm tích cực yêu cầu chúng ta phải có gán tổng giá trị ít nhất cho nó.Ti=1M1iTlogM1

Bằng chứng bổ đề: Hãy nhìn vào lần đầu tiên bạn thực hiện phản ứng đó tích cực. Nếu đó là giữa và , thì nó đã bị giảm ít nhất lần, và do đó bạn cần phải tăng lên gấp lần để kết thúc dương. Nhưng mỗi gia số này gán cho nó một giá trị ít nhất là .kT(k1)Tk1k1k

Và đây là giới hạn trên cho câu hỏi 1. Chúng ta hãy sử dụng chiến lược chứng minh tổng thể giống như trước đây. Một lần nữa, chúng ta gán giá trị là khi chúng ta tăng số đếm trên một bước giữa và . Chúng tôi cũng chỉ định giá trị khi chúng tôi tăng bộ đếm trên một bước giữa và và giá trị nếu chúng tôi tăng bộ đếm trước đó. Với lý do tương tự như trước đây, bất kỳ bộ đếm nào là ở bước phải được gán giá trị ít nhất là . Nhưng bây giờ, nếu một bộ đếm tích cực ở bước1kkT+1(k1)T -2MT-MT00-2MT1-2MT1MTlogM+TT(logM+1)1M2MTMT002MT12MT, nó vẫn phải được gán tổng giá trị ít nhất là , vì nó phải được tăng lên lần để kết thúc dương. Bây giờ, tổng giá trị chúng ta phải gán là , do đó chúng ta có thể có tối đa các bộ đếm dương .1MTlogM+TT(logM+1)


Cảm ơn câu trả lời! Tôi thực sự quan tâm nhiều hơn đến giới hạn dưới của câu hỏi (2). Động lực cho câu hỏi này đến từ thuật toán tôi có để đếm xấp xỉ các mục trong cửa sổ trượt (mỗi lần lặp bạn thấy một số phần tử và mọi truy vấn đều có dạng "bao nhiêu lần xuất hiện trong bước cuối cùng ). giảm dần được thực hiện để giữ cho số lượng bộ đếm dương nhỏ (nhưng làm tăng lỗi) và tôi có thể xóa bộ đệm mỗi bước và vẫn giữ lỗi nhỏ, nhưng tôi tự hỏi liệu có thực sự là bộ đếm có thể dương,x N N = T M Ω ( T log M )xxNN=TMΩ(TlogM)
RB

Hoặc có lẽ tôi có thể đưa ra một ràng buộc tốt hơn. Cảm ơn một lần nữa.
RB
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.