Những nền tảng của Machine Learning , của Mehryar Mohri, Afshin Rostamizadeh và Ameet Talwalkar, là một cuốn sách năm 2012 về lý thuyết học máy.
Hiểu về học máy: Từ lý thuyết đến thuật toán , của Shai Shalev-Shwartz và Shai Ben-David, là một cuốn sách tương tự năm 2014 khá nổi tiếng và nhắm mục tiêu giới thiệu hơn một chút so với Mohri / Rostamizadeh / Talwalkar, nhưng vẫn còn nhiều lý thuyết trong nó Nó có sẵn miễn phí trực tuyến.
Học tập mạng lưới thần kinh: Các nền tảng lý thuyết , của Martin Anthony và Peter Bartlett, là một cuốn sách năm 1999 về lý thuyết ML được coi là về mạng lưới thần kinh, nhưng (theo ấn tượng của tôi không đọc nó) chủ yếu là về lý thuyết ML nói chung.
Ba cuốn sách này chủ yếu lấy quan điểm chủ yếu của lý thuyết học thống kê. Ngoài ra còn có một quan điểm thú vị được gọi là lý thuyết học tính toán , được truyền cảm hứng nhiều hơn bởi lý thuyết khoa học máy tính. Tôi nghĩ rằng cuốn sách giới thiệu tiêu chuẩn trong lĩnh vực này là Giới thiệu về Lý thuyết học tập tính toán , một cuốn sách năm 1994 của Michael Kearns và Umesh Vazirani.
Một cuốn sách xuất sắc miễn phí và được đề xuất miễn phí khác là Trevor Hastie, Robert Tibshirani, và ấn bản thứ hai năm 2009 của Jerome Friedman về The Elements of Statistics Learning . Có lẽ nó ít lý thuyết hơn những cái khác, và nhiều hơn từ quan điểm của nhà thống kê so với người học máy, nhưng vẫn có nhiều hứng thú.
Ngoài ra, nếu bạn quan tâm đặc biệt về độ dốc gốc, tham chiếu tiêu chuẩn là Tối ưu hóa lồi của Stephen Boyd và Lieven Vandenberghe. Cuốn sách năm 2004 này là miễn phí có sẵn trực tuyến.
Không có cuốn sách nào trong số này chứa đựng nhiều về lý thuyết hiện đại về các mạng sâu, nếu đó là điều bạn quan tâm. (Ví dụ, hầu hết các lý thuyết tối ưu hóa sẽ là về các trường hợp lồi, mà các mạng sâu quyết định là không.) Đó là vì lý thuyết này rất mới; hầu hết các kết quả chỉ đến trong vài năm qua, và nó vẫn còn rất nhiều điều được tìm ra. Nhưng, như một tổng quan về sự hiểu biết cơ bản về lĩnh vực này cho đến nay, bất kỳ ai trong số họ sẽ giúp bạn hiểu rõ về các công việc được thực hiện (ngoại trừ Kearns / Vazirani, tập trung vào các khía cạnh phân tích khác nhau mà tôi ' m không chắc chắn đã được áp dụng thành công vào các mạng sâu - chưa).