Tôi có một nền tảng về lập trình máy tính và lý thuyết số cơ bản, nhưng không được đào tạo thống kê thực sự và gần đây đã "phát hiện" rằng thế giới tuyệt vời của toàn bộ các kỹ thuật thực sự là một thế giới thống kê. Dường như các yếu tố ma trận, hoàn thành ma trận, tenxơ cao, nhúng, ước lượng mật độ, suy luận Bayes, phân vùng Markov, tính toán eigenvector, PageRank đều là các kỹ thuật thống kê cao và thuật toán học máy sử dụng những thứ đó, sử dụng rất nhiều số liệu thống kê .
Mục tiêu của tôi là có thể đọc các bài báo thảo luận về những điều đó, và thực hiện hoặc tạo ra các thuật toán, trong khi hiểu các ký hiệu, "bằng chứng" và các đối số thống kê được sử dụng. Tôi đoán điều khó nhất là tuân theo tất cả các bằng chứng liên quan đến ma trận.
Những giấy tờ cơ bản có thể giúp tôi bắt đầu? Hoặc một cuốn sách giáo khoa tốt với các bài tập đáng để làm việc thông qua?
Cụ thể, một số giấy tờ tôi muốn hiểu hoàn toàn là:
- Hoàn thành ma trận chính xác thông qua tối ưu hóa lồi, Candes, Recht, 2008
- Biến đổi nhanh Cauchy và hồi quy tuyến tính mạnh mẽ nhanh hơn, Clarkson và cộng sự, 2013
- Dự đoán ngẫu nhiên cho các máy Vector hỗ trợ, Paul et al, 2013
- Ước tính xác suất chiều cao với các mô hình mật độ sâu, Rippel, Adams, 2013
- Có được các ước tính tối thiểu hóa lỗi và các giới hạn lỗi phổ biến cho việc hoàn thành ma trận cấp thấp, Király, Theran, 2013