Cách tốt nhất để tìm hiểu các nguyên tắc cơ bản của xác suất cần thiết cho các thuật toán học máy là gì?


13

Tôi đã tham gia một khóa học xác suất ở trường đại học một vài năm trước đây, nhưng bây giờ tôi đang trải qua một số thuật toán học máy và một số môn toán chỉ là sự lộn xộn.

Cụ thể ngay bây giờ, tôi đang học thuật toán EM (tối đa hóa kỳ vọng) và dường như có một sự mất kết nối lớn giữa những gì được yêu cầu và những gì tôi có.

Tôi không yêu cầu một cuốn sách hoặc một trang web, nhưng cách để học đủ các chủ đề này là gì để có thể hiểu kỹ về các thuật toán sử dụng chúng? Có bắt buộc phải đi qua một cuốn sách và làm hàng trăm bài tập không? Hay đó là quá mức theo nghĩa này?

chỉnh sửa: Nếu đây là vị trí sai cho câu hỏi này, vui lòng bỏ phiếu để di chuyển :)


Không biết về CV! Có cách nào để di chuyển câu hỏi sang đó không?

2
Tôi đã bỏ phiếu để di chuyển. :)
JM không phải là một nhà thống kê

Cách tốt nhất để học một cái gì đó là chia nó thành những mảnh nhỏ. Tại sao không hỏi trên trang web này về một hoặc hai câu hỏi cụ thể hoặc các khái niệm đang làm phiền bạn?
charles.y.zheng

Câu trả lời:


6

Nhiều cuốn sách và phần giới thiệu trực tuyến về học máy cung cấp một chút giới thiệu về xác suất cần thiết của chúng trong nội dung của chúng, vì vậy tôi sẽ bắt đầu với một hoặc một vài cuốn sách cho loại đó. Ngoài đỉnh đầu tôi có thể nghĩ đến Nhận dạng mẫu thống kê (có thể là do tôi đã học EM ở đó) và Các yếu tố của học thống kê .

Lời khuyên thực sự của tôi sẽ là Hướng dẫn khai thác dữ liệu thống kê của Andrew Moore. Đó là trang web thu hẹp khoảng cách tôi có trước khi tôi bắt đầu học tiến sĩ (đến từ một nền tảng kỹ thuật). Tôi biết bạn nói rằng bạn không hỏi về một trang web, nhưng hãy xem Xác suất cho Công cụ khai thác dữ liệu ở đó và các trang Xác suất khác trước khi bạn quyết định. Và hãy xem Mô hình hỗn hợp Gaussian cho EM.

Có bắt buộc phải đi qua một cuốn sách và làm hàng trăm bài tập không?

Tôi không nghĩ vậy. Tính toán xác suất trong học máy có xu hướng tập trung xung quanh một vài con đường nổi tiếng. Nắm bắt mạnh mẽ phân phối Gaussian đơn và đa chiều và nghiên cứu một vài giải thích về EM sẽ giúp bạn đi khá xa. Và đại số tuyến tính. Bạn sẽ cần rất nhiều đại số tuyến tính.


-3

Trí tuệ nhân tạo đã đạt được tầm quan trọng trong thập kỷ qua với rất nhiều tùy thuộc vào sự phát triển và tích hợp của AI trong cuộc sống hàng ngày của chúng ta. Tiến bộ mà AI đã đạt được là đáng kinh ngạc với những chiếc xe tự lái, chẩn đoán y tế và thậm chí đặt cược con người vào các trò chơi chiến lược như cờ vây và cờ vua.

Tương lai cho AI vô cùng hứa hẹn và không còn xa khi chúng ta có những người bạn đồng hành của riêng mình. Điều này đã thúc đẩy rất nhiều nhà phát triển bắt đầu viết mã và bắt đầu phát triển cho các chương trình AI và ML. Tuy nhiên, học viết thuật toán cho AI và ML không dễ và đòi hỏi kiến ​​thức toán học và lập trình sâu rộng.

Toán học đóng một vai trò quan trọng vì nó xây dựng nền tảng để lập trình cho hai luồng này.

Có nhiều lý do tại sao toán học là quan trọng cho học máy. Một số trong số họ là dưới đây:

Chọn đúng thuật toán bao gồm cân nhắc về độ chính xác, thời gian đào tạo, độ phức tạp của mô hình, số lượng tham số và số lượng tính năng. Chọn cài đặt tham số và chiến lược xác nhận. Xác định thiếu và thừa bằng cách hiểu sự đánh đổi Bias-Variance. Ước tính khoảng tin cậy đúng và không chắc chắn.

Những loại toán học là cần thiết cho máy học?

Toán học là hoàn toàn cần thiết cho nghiên cứu về Machine Learning hoặc Artificial Intelligence. Bất kỳ hiểu biết sâu sắc hơn về các khái niệm và thuật toán trong ML đòi hỏi một số kiến ​​thức toán học cơ bản.

Ba lý thuyết toán học chính: Đại số tuyến tính, Tính toán đa biến và Lý thuyết xác suất.

Đại số tuyến tính -

Ký hiệu đại số tuyến tính được sử dụng trong Machine Learning để mô tả các tham số và cấu trúc của các thuật toán học máy khác nhau. Điều này làm cho đại số tuyến tính là một điều cần thiết để hiểu làm thế nào các mạng thần kinh được kết hợp với nhau và cách chúng hoạt động.

Nó bao gồm các chủ đề như:

Vô hướng, vectơ, ma trận, ma trận định mức ma trận Ma trận đặc biệt và vectơ Eigenvalues ​​và Eigenvector Tính toán đa biến -

Điều này được sử dụng để bổ sung cho phần học tập của máy học. Đó là những gì được sử dụng để học hỏi từ các ví dụ, cập nhật các tham số của các mô hình khác nhau và cải thiện hiệu suất.

Nó bao gồm các chủ đề như:

Các tích phân đạo hàm Các toán tử vi phân Các lý thuyết xác suất tối ưu hóa lồi -

Các lý thuyết được sử dụng để đưa ra các giả định về dữ liệu cơ bản khi chúng ta đang thiết kế các thuật toán học sâu hoặc AI này. Điều quan trọng là chúng ta phải hiểu các phân phối xác suất chính,

Nó bao gồm các chủ đề như:

Các yếu tố của xác suất Biến ngẫu nhiên Phân phối Phương sai và kỳ vọng Biến ngẫu nhiên đặc biệt Làm thế nào để học toán cho học máy nhanh chóng?

Cách tự học toán bắt đầu cho khoa học dữ liệu là học bằng cách làm shit. Trực tiếp, bạn sẽ muốn học hoặc xem lại lý thuyết cơ bản từ trước. Bạn không cần phải đọc toàn bộ sách giáo khoa, nhưng trước tiên bạn sẽ muốn tìm hiểu các khái niệm chính.

Là điều kiện tiên quyết mềm, tôi giả sử sự thoải mái cơ bản với phép tính đại số / ma trận tuyến tính (để bạn không bị kẹt vào ký hiệu) và xác suất giới thiệu.

Nếu bạn muốn học toán cho máy học sâu thì có n số khóa học có sẵn trực tuyến, chẳng hạn như,

Đại số tuyến tính, Xác suất & Thống kê, Tính toán đa biến và Tối ưu hóa của Khan Academy.

Nền tảng toán học cho máy học và AI trên eduonix

Học máy học toán học đằng sau udemy

Mã hóa ma trận: Đại số tuyến tính thông qua các ứng dụng khoa học máy tính của Philip Klein, Đại học Brown.

Cuốn sách của Larry Wasserman - Tất cả các số liệu thống kê: Một khóa học ngắn gọn về suy luận thống kê.

Hãy nhớ rằng bạn học tốt nhất bằng cách thực hiện, và thật đáng buồn là các khóa học này không chứa đủ bài tập và bài tập về nhà

Những gì tôi khuyên là, Quỹ toán học cho máy học và AI - Khóa học này không phải là một chương trình toán học đầy đủ; nó không được thiết kế để thay thế giáo dục toán học ở trường hoặc đại học. Thay vào đó, nó tập trung vào các khái niệm toán học chính mà bạn sẽ gặp trong các nghiên cứu về học máy.

Bạn sẽ học được gì:

Và nhiều hơn nữa……

Kết thúc khóa học này, bạn sẽ không chỉ có kiến ​​thức để xây dựng các thuật toán của riêng mình mà còn có sự tự tin để thực sự bắt đầu đưa các thuật toán của mình vào sử dụng trong các dự án tiếp theo của bạn.

Khóa học cũng đi kèm với các dự án và câu đố để giúp củng cố kiến ​​thức của bạn về các khái niệm toán học.

Nó được thiết kế để lấp đầy những khoảng trống cho những học sinh bỏ lỡ những khái niệm quan trọng này như là một phần của giáo dục chính thức, hoặc những người cần làm mới ký ức sau một thời gian dài nghỉ học toán.

Tôi nghĩ rằng khóa học này tốt hơn rất nhiều so với đầu tư 2 đến 3 tháng lướt qua tài liệu lúc ban đầu và sau đó quên đi một nửa những gì bạn đã học được khi bạn gặp nó.

Cố gắng hiểu các khái niệm cơ bản được hiển thị và luôn nhớ để vui chơi!

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.