Là một nền tảng mạnh mẽ trong toán học là một điều cần thiết cho ML? - một câu trả lời và một số suy đoán cho ML được khái niệm hóa như là số liệu thống kê ;-)
Khoảng năm 1990 tôi đã hy vọng đại số máy tính được hỗ trợ, tôi nghĩ là vậy nhưng nó khá hạn chế. Nhưng nó chắc chắn giúp tăng tốc việc học toán (ít cần phát triển các kỹ năng thao túng bằng cách thực hành hoặc cố gắng để có được bằng cách chỉ có thể làm các bài tập đơn giản). Tôi tìm thấy Đại số tuyến tính của Fred Szabo với Mathematica là một ví dụ tuyệt vời về điều này (nhưng tôi đã tham gia một khóa học đại số tuyến tính cấp độ lý thuyết nâng cao.)
Tôi đã làm việc từ năm 1988 (Sử dụng các phương pháp chuyên sâu máy tính để "cụ thể hóa" các định lý và nguyên tắc từ thống kê - Chính xác) để đưa ra câu trả lời không hoặc ít nhất là không cần thiết (để thống kê). Một người sẽ luôn có thể hiểu nhanh hơn và tổng quát hơn với kỹ năng toán học và hiểu biết thêm. Tôi nghĩ rằng tôi đang bắt đầu gần gũi, nhưng người ta cần một đại diện có thể thao tác các mô hình tạo xác suất và suy luận có giá trị và hữu ích cho nhiều vấn đề hơn là chỉ các vấn đề về đồ chơi.
Tôi có nên thử và điền vào chỗ trống của toán học trước khi tiếp tục với ML không?
Đó là một nỗ lực khó khăn - trong MHO, hầu hết mọi người hiểu về thống kê đều có được bằng cách rất thoải mái khi thao tác với các biểu diễn toán học tiêu chuẩn và đặc biệt không phải là mô hình tạo xác suất và đặc tính toán học suy luận (x% hàng đầu của thống kê toán học Phds). Vì vậy, nó không chỉ là cơ bản mà còn thực sự thoải mái với toán học. (Như một bên, đối với tôi Lý thuyết Fourier là điều cần thiết.)
Tại sao các biểu diễn này khó (thậm chí với rất nhiều toán học)?
Gerd Gigerenzer đã khẳng định khá nhiều rằng không có thách thức nào đối với bệnh đơn giản dương tính / âm tính với xét nghiệm dương tính / âm tính bằng cách sử dụng tần số _natural. Một tài liệu tham khảo từ câu hỏi được liên kết dường như sử dụng tốt http://www.autonlab.org/tutorials/prob18.pdf
Tại sao điều này khó để khái quát?
Đối với các bài kiểm tra k (lặp lại và hoặc khác nhau) - 2 ^ k
Đối với các thử nghiệm lấy giá trị v - v ^ k
Vì vậy, đối với nhị phân không xác định - xác suất đường dẫn mẫu 2 * v ^ k
Đối với p nhiều ẩn số nhị phân 2 ^ p * v ^ k
Đối với p nhiều ẩn số hợp lý Q ^ p * v ^ k
Người ta nhanh chóng chuyển sang toán học với vô số vô số và không thể đếm được để đối phó với điều này, điều mà ngay cả với chuyên môn toán học cũng dẫn đến nhiều hiểu lầm và nghịch lý (ví dụ nghịch lý của Borel?)
Ngoài ra, còn có những hiểu lầm nguy hiểm tuyến tính đến phi tuyến tính (ví dụ: Nguy hiểm ẩn của việc chỉ định các nhà tiên tri không phù hợp Winbugs và MCMC khác mà không có thông tin để phân phối trước ) và các tương tác và hiệu ứng ngẫu nhiên, v.v.