Sự đánh đổi thời gian / lỗi tốt nhất có thể cho giải pháp gần đúng của các chương trình tuyến tính là gì?


19

Để cụ thể, hãy xem xét LP để giải quyết trò chơi có tổng bằng hai người chơi trong đó mỗi người chơi có hành động. Giả sử mỗi mục nhập của ma trận xuất chi A nhiều nhất là 1 trong giá trị tuyệt đối. Để đơn giản, chúng ta đừng đưa ra giả định thưa thớt.nA

Giả sử thời gian chạy có sẵn để xấp xỉ giá trị của trò chơi này.T

Một kỹ thuật để xấp xỉ giá trị này là phương pháp cập nhật nhân (được gọi là học không hối tiếc trong bối cảnh này). Điều này cho phép một lỗi của , trong đó ˜ O ẩn các yếu tố log.O~(n/T)O~

Tôi không biết chính xác cảnh quan lỗi cho phương thức điểm bên trong nổi tiếng nhất trông như thế nào, nhưng tôi đoán lỗi là một cái gì đó giống như .O(exp(T/n3))

Các phương pháp cập nhật nhân giống cung cấp cho lỗi đó là một đa thức nghịch đảo trong . Phương pháp điểm nội thất cho lỗi đó là theo cấp số nhân nhỏ ở T . Do đó, lỗi tốt nhất của cả hai giảm dần trong một thời gian cho đến khi điểm bên trong bắt kịp, sau đó lỗi đột nhiên rơi xuống một vách đá. Bản năng của tôi là chống lại sự đánh đổi thời gian / lỗi tốt nhất có thể hành xử theo cách này.TT

Câu hỏi của tôi :

Có một thuật toán để lập trình tuyến tính gần đúng giúp làm mịn góc của đường cong đánh đổi thời gian / lỗi không? Đó là, một thuật toán thực hiện ít nhất cũng như tốt nhất trong hai thuật toán cho bất kỳ giá trị nào của tham số thời gian có sẵn và có sự đánh đổi thời gian / lỗi tương đối trơn tru. Một cách thông minh hơn để kết hợp các kỹ thuật cập nhật nhân và nội bộ hơn là tận dụng tốt hơn cả hai là một cách có khả năng để có được thuật toán như vậy.

Tài liệu tham khảo :

Cập nhật nhân số nói chung:

http://www.cs.princeton.edu/~arora/pub/MWsurvey.pdf

Cập nhật nhân cho các trò chơi tổng bằng không:

http://dx.doi.org/10.1016/0167-6377(95)00032-0

Cập nhật nhân cho bao / LP đóng gói:

http://arxiv.org/PS_cache/arxiv/pdf/0801/0801.1987v1.pdf

Giấy điểm nội thất gốc:

http://math.stanford.edu/~lekheng/cifts/302/ classics / karmarkar.pdf

Điểm nội bộ từ góc độ toán học ứng dụng:

Lập trình phi tuyến của Bertsekas , phần 4.1.1.

Câu trả lời:


2

Có lẽ tài liệu tham khảo này sẽ có liên quan đến câu hỏi của bạn.

Grigoriadis M., Khachiyan L. Một thuật toán xấp xỉ ngẫu nhiên tuyến tính ngẫu nhiên cho các trò chơi ma trận // Toán tử. Độ phân giải Lett. 1995. V. 18. Số 2. P. 53-58.

Thuật toán trong đó có 1) ngẫu nhiên 2) lỗi là THÊM, nhưng 3) là tuyến tính (bạn chỉ cần kiểm tra một phần rất nhỏ của đầu vào để tìm solutiom với xác suất cao).

Serge


Quả thực giấy đó khá liên quan. Đó là liên kết thứ hai được đưa ra trong phần tham khảo câu hỏi của tôi.
Warren Schudy

Ân xá. Tôi đã bỏ qua rằng các tài liệu tham khảo đã tồn tại. Do đó, bình luận của tôi nên được xóa hoặc coi là một đánh giá về một trong những văn bản trong danh sách của bạn. Một số kết quả bổ sung có cùng bản chất nhưng thông qua khung tổng quát hơn có thể được tìm thấy trong Juditsky, A., Lan, G., Nemirovski, A., Shapiro, A. Phương pháp xấp xỉ ngẫu nhiên để lập trình Stochastic - Tạp chí SIAM về Tối ưu hóa 19: 4 (2009), 1574-1609. Sergey
Sergey
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.