Gần đây, trong một lớp học về máy học từ giáo sư Oriol Pujol tại UPC / Barcelona, ông đã mô tả các thuật toán, nguyên tắc và khái niệm phổ biến nhất để sử dụng cho một loạt các nhiệm vụ liên quan đến học máy. Ở đây tôi chia sẻ chúng với bạn và hỏi bạn:
- Có bất kỳ nhiệm vụ phù hợp khung toàn diện với các phương pháp hoặc phương pháp liên quan đến các loại vấn đề khác nhau liên quan đến máy học không?
Làm thế nào để tôi học một Gaussian đơn giản? Xác suất, biến ngẫu nhiên, phân phối; ước tính, hội tụ và tiệm cận, khoảng tin cậy.
Làm thế nào để tôi học một hỗn hợp Gaussian (MoG)? Khả năng, tối đa hóa kỳ vọng (EM); khái quát hóa, lựa chọn mô hình, xác nhận chéo; phương tiện k, mô hình markov ẩn (HMM)
Làm thế nào để tôi học bất kỳ mật độ? Ước lượng tham số so với không tham số, Sobolev và các không gian chức năng khác; l 2 lỗi; Ước tính mật độ hạt nhân (KDE), hạt nhân tối ưu, lý thuyết KDE
Làm thế nào để tôi dự đoán một biến liên tục (hồi quy)? Hồi quy tuyến tính, chính quy, hồi quy sườn và LASSO; hồi quy tuyến tính cục bộ; ước tính mật độ có điều kiện.
Làm thế nào để tôi dự đoán một biến rời rạc (phân loại)? Phân loại Bayes, Bayes ngây thơ, hào phóng và phân biệt đối xử; perceptron, giảm trọng lượng, máy vectơ hỗ trợ tuyến tính; lý thuyết phân loại hàng xóm gần nhất
Nên sử dụng chức năng mất nào? Lý thuyết ước tính khả năng tối đa; l -2 ước tính; Dự toán Bayessian; minimax và lý thuyết quyết định, chủ nghĩa Bayes vs chủ nghĩa thường xuyên
Tôi nên sử dụng mô hình nào? AIC và BIC; Lý thuyết vnnik-Chervonenskis; lý thuyết xác nhận chéo; bootstrapping; Có lẽ là lý thuyết gần đúng (PAC); Giới hạn bắt nguồn từ
Làm thế nào tôi có thể học các mô hình fancier (kết hợp)? Học tập lý thuyết; thúc đẩy; đóng bao; xếp chồng
Làm thế nào tôi có thể học các mô hình fancier (phi tuyến)? Mô hình tuyến tính tổng quát, hồi quy logistic; Định lý Kolmogorov, mô hình phụ gia tổng quát; nhân hóa, tái tạo không gian Hilbert kernel, SVM phi tuyến tính, hồi quy quy trình Gaussian
Làm thế nào tôi có thể học các mô hình fancier (sáng tác)? Mô hình đệ quy, cây quyết định, phân cụm phân cấp; mạng lưới thần kinh, truyền bá trở lại, mạng lưới niềm tin sâu sắc; mô hình đồ họa, hỗn hợp các HMM, trường ngẫu nhiên có điều kiện, mạng Markov tối đa; mô hình log-linear; ngữ pháp
Làm cách nào để giảm hoặc liên quan các tính năng? Lựa chọn tính năng so với giảm kích thước, phương pháp trình bao bọc để lựa chọn tính năng; quan hệ nhân quả và tương quan, tương quan một phần, học cấu trúc mạng Bayes
Làm cách nào để tạo các tính năng mới? phân tích thành phần chính (PCA), phân tích thành phần độc lập (ICA), nhân rộng đa chiều, học đa dạng, giảm kích thước có giám sát, học theo hệ mét
Làm cách nào để giảm hoặc liên quan đến dữ liệu? Phân cụm, phân cụm, phân cụm hạn chế; quy tắc hiệp hội và phân tích giỏ thị trường; hồi quy xếp hạng / thứ tự; phân tích liên kết; dữ liệu quan hệ
Làm thế nào để tôi điều trị chuỗi thời gian? ARMA; Bộ lọc Kalman và mô hình không gian stat, bộ lọc hạt; phân tích dữ liệu chức năng; phát hiện điểm thay đổi; xác nhận chéo cho chuỗi thời gian
Làm thế nào để tôi xử lý dữ liệu không lý tưởng? thay đổi đồng biến; mất cân bằng giai cấp; thiếu dữ liệu, dữ liệu lấy mẫu không thường xuyên, lỗi đo lường; phát hiện bất thường, mạnh mẽ
Làm cách nào để tối ưu hóa các tham số? Không bị ràng buộc so với tối ưu hóa bị ràng buộc / lồi, phương pháp không có đạo hàm, phương pháp thứ nhất và thứ hai, backfelling; độ dốc tự nhiên; tối ưu hóa ràng buộc và EM
Làm cách nào để tối ưu hóa các hàm tuyến tính? đại số tuyến tính tính toán, đảo ngược ma trận cho hồi quy, phân rã giá trị số ít (SVD) để giảm kích thước
Làm cách nào để tối ưu hóa với các ràng buộc? Độ lồi, số nhân Lagrange, điều kiện Karush-Kuhn-Tucker, phương pháp điểm bên trong, thuật toán SMO cho SVM
Làm thế nào để tôi đánh giá các khoản tiền lồng nhau sâu sắc? Suy luận mô hình đồ họa chính xác, giới hạn thay đổi trên tổng, suy luận mô hình đồ họa gần đúng, lan truyền kỳ vọng
Làm cách nào để đánh giá số tiền lớn và tìm kiếm? Các vấn đề cơ thể N tổng quát (GNP), cấu trúc dữ liệu phân cấp, tìm kiếm lân cận gần nhất, phương pháp đa nhanh; Tích hợp Monte Carlo, Chuỗi Markov Monte Carlo, Monte Carlo SVD
Làm thế nào để tôi điều trị các vấn đề thậm chí lớn hơn? EM song song / phân phối, GNP song song / phân phối; phương pháp nâng cấp ngẫu nhiên, học trực tuyến
Làm thế nào để tôi áp dụng tất cả điều này trong thế giới thực? Tổng quan về các phần của ML, lựa chọn giữa các phương pháp để sử dụng cho từng nhiệm vụ, kiến thức và giả định trước đó; phân tích dữ liệu thăm dò và trực quan hóa thông tin; đánh giá và giải thích, sử dụng khoảng tin cậy và kiểm tra giả thuyết, các đường cong ROC; vấn đề nghiên cứu trong ML là ở đâu