độ phức tạp của mô hình phù hợp với dữ liệu


8

Giả sử f:R×RR là một số hàm liên tục

x1xn là một tập hợp các giá trị thực, và chúng tôi muốn tính toán

argminaif(a,xi) đến độ chính xác theo quy định

Có một số kết quả về khó khăn của vấn đề này cho các f khác nhau?

Chẳng hạn, giả sử f(m,x)=(mx)2 . Tối thiểu của vấn đề của chúng tôi bây giờ là giá trị trung bình của x, dễ tính toán. Mặt khác, giả sử f(m,x)=log(1+exp(mx)) , không có giải pháp dạng đóng, vì vậy có vẻ như argmin khó tính toán hơn ... hay là vậy?

Động lực: vấn đề tối thiểu hóa này xuất hiện khi lắp mô hình vào dữ liệu. Ví dụ đầu tiên của f là bình phương nhỏ nhất phù hợp và f thứ hai là hồi quy logistic.

Chỉnh sửa : Tôi vừa thấy một câu hỏi liên quan , và đó là trên tinh thần của những gì tôi đã hỏi, cho một sự lựa chọn cụ thể của f

Câu trả lời:


6

f

Có nhiều phương pháp số tốt hơn khác với các đảm bảo khác nhau (tùy thuộc vào các thuộc tính của hàm) để tối ưu hóa các hàm lồi - cuốn sách này là một tài liệu tham khảo tốt (và miễn phí!).


Một lưu ý thêm: mất vuông, mất logistic và phân kỳ Bregman (trong đối số đầu tiên của chúng) là lồi.
Lev Reyzin

Tôi nghĩ rằng tất cả tối ưu hóa lồi đều dễ dàng cho đến khi gần đây tôi bắt gặp một số mục tiêu lồi mà tất cả các tối ưu hóa số mà tôi đã thử (bao gồm cả phương pháp của Newton với Hessian chính xác). Vấn đề là mục tiêu đó quá phẳng. Giải pháp là sử dụng các phương pháp đại số ( tinyurl.com/2dz8wky ), điều này cho thấy một số vấn đề tối ưu hóa lồi thực tế là khó khăn
Yaroslav Bulatov

Tôi đoán nó phụ thuộc vào ý nghĩa của khó / dễ. Nếu bạn có một ràng buộc hộp trên tên miền, bạn luôn có thể thực hiện tìm kiếm nhị phân.
Lev Reyzin

1
OK, đó là sự thật. Lý do cho câu hỏi này là điều đáng ngạc nhiên với tôi rằng bạn có thể lấy một mô hình phù hợp với độ khó của nó, thực hiện một thay đổi nhỏ trong đo lường mức độ phù hợp và có được một mô hình phù hợp dễ dàng. (nghĩa là khả năng tối đa so với khả năng giả ngẫu nhiên đối với các mô hình đồ họa dày đặc, cả hai đều là công cụ ước tính nhất quán, nhưng chỉ có một khả năng có thể điều chỉnh được)
Yaroslav Bulatov

9

Bạn có thể đã nhận thức được điều này, nhưng nếu f là phân kỳ Bregman , thì arg min này luôn có một giải pháp dễ dàng. Biểu mẫu cụ thể phụ thuộc vào thứ tự của các tham số, nhưng nếu biểu thức được thu nhỏ là

argminaif(xi,a)

Trong đó là phân kỳ Bregman, thì câu trả lời luôn là giá trị trung bình của . Nếu thứ tự của các tham số là cách khác, thì bạn có thể sử dụng tính nhị phân của các phân kỳ Bregman. Cụ thể, nếu được tạo bởi hàm lồi nghiêm ngặt , thì giải pháp là -mean được đưa ra bởi .fxifϕϕc

ϕ(c)=(1/n)iϕ(xi)

Một trường hợp thú vị khác là khi là chỉ tiêu Euclide (không bình phương). Trong trường hợp đó, arg min là điểm Fermat-Weber nổi tiếng và đã được nghiên cứu rộng rãi trong nghiên cứu hoạt động. Có một sơ đồ lặp tối ưu toàn cầu để giải quyết nó, nhưng không có biểu thức dạng đóng.f


Thật thú vị, không biết điều này ... bạn có tham khảo công thức phi trung bình không? Tôi đang tự hỏi liệu điều này có đưa ra một cách nhanh hơn để phù hợp với các mô hình hồi quy logistic hay không
Yaroslav Bulatov

5
đạo hàm rất đơn giản (tính toán cơ bản, kết hợp với Fenchel dual), nhưng một tài liệu tham khảo là bài báo JMLR của Banerjee et al: jmlr.csail.mit.edu/ con / v6 / banerjee05b.html
Suresh Venkat
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.