Câu trả lời:
Nếu bạn muốn có một cuốn sách hướng đến ứng dụng, hãy xem xét Máy học dựa trên mô hình của Christopher Bishop . Ông có nhiều sách kỹ thuật được đánh giá cao.
Nếu bạn đang tìm kiếm nhiều mã, Lập trình Xác suất & Phương pháp Bayes cho Hacker là một lựa chọn.
Một cuốn sách giới thiệu với một cong thống kê hơn là Giới thiệu để học tập thống kê với các ứng dụng trong R . Một lần nữa, các tác giả có một phiên bản kỹ thuật được đánh giá cao của cuốn sách.
Tôi đã có cùng một câu hỏi một vài tuần trước.
Cá nhân tôi thấy Python của Phân tích dữ liệu của O'Reilly rất hữu ích trong việc học những điều cơ bản. Cuốn sách giả định rằng bạn có một số kinh nghiệm lập trình python, nhưng nó cũng có một phụ lục ở phía sau để đi qua những điều cơ bản.
Tác giả cung cấp cho bạn rất nhiều ví dụ về thế giới thực (không phải Monty Python) ngay từ đầu bạn có thể tạo trong vài chương đầu tiên, sau đó đi vào chi tiết về từng điều khi cuốn sách tiếp tục, xây dựng kiến thức của bạn.
Tôi tìm thấy các hướng dẫn rất dễ dàng và từng bước. Giáo sư của tôi, người hướng dẫn tôi trong tất cả những điều này đã rất ấn tượng khi tôi học nhanh.
Tôi cũng đã nghe những điều tốt về Kaggle.
Khoa học dữ liệu trên đám mây với Microsoft Azure Machine Learning và R là một cuốn sách giáo khoa miễn phí hoạt động thông qua một ví dụ rất chi tiết. Đừng bỏ qua các công cụ cụ thể được sử dụng vì bạn không cần chúng để nhận được một số lợi ích từ cuốn sách.
Một dự án khác mà tôi rất thích là Lập trình trí tuệ tập thể cũng trải qua một số dự án một cách chi tiết, bao gồm cả phần cào web mà hầu hết các cuốn sách đều đề cập.
Tôi có thể giới thiệu bộ sưu tập Sổ tay Ipython này bao gồm Sổ ghi chép nhận xét Khoa học dữ liệu, Thống kê và Máy học.
https://github.com/ipython/ipython/wiki/A-gallery-of-interesting-IPython-Notebooks
Một nơi bạn có thể tìm thấy một số giải thích từng bước thú vị là hướng dẫn của Kaggle và các cuộc phỏng vấn của người chiến thắng . Thông thường mọi người sẽ đăng một bản tóm tắt chi tiết về phương pháp của họ.
Một trong những cuốn sách hay nhất tôi đã tìm thấy là Machine Learning in Python từ Sebastian Raschka. Ví dụ dễ dàng, giải thích từng bước và số lượng toán vừa phải.
Cấu trúc của cuốn sách bao gồm toàn bộ quá trình từ làm sạch dữ liệu đến tập hợp và đánh giá.
Có một cái nhìn tại:
https://www.analyticsvidhya.com/blog/2016/01/complete-tutorial-learn-data-science-python-scratch-2/
Điều này có một hướng dẫn từng bước sẽ cho bạn ý tưởng về toàn bộ quá trình Khám phá dữ liệu, Phân tích dữ liệu và Xây dựng mô hình dự đoán.
Giải thích về Khám phá dữ liệu và Kỹ thuật tính năng (cách chọn các tính năng có liên quan) có tại đây:
https://www.analyticsvidhya.com/blog/2016/01/guide-data-exploration/
Xem 5 Bộ dữ liệu đầu tiên tại đây có hướng dẫn và làm việc với chúng để có được trải nghiệm thực tế:
Cũng có một cái nhìn tại:
http://machinelearningmastery.com/machine-learning-in-python-step-by-step/
trong đó anh ta sử dụng nhiều mô hình trên một tập dữ liệu duy nhất sẽ cho bạn hiểu mức độ cơ bản của các mô hình khác nhau.
Để hiểu thêm về lựa chọn mô hình, hãy xem điều này:
https://www.quora.com/Data-Science-How-do-Data-Sellectists-perform-model-selection
Liên kết trên có câu trả lời được đưa ra bởi những người làm việc trong lĩnh vực này.
Để hiểu rõ hơn về các bộ dữ liệu khác nhau, bạn luôn có thể đăng nhập vào kaggle và trải qua các cuộc thi và xem xét một loạt các bộ dữ liệu, nơi bạn có quyền truy cập vào mã của mọi người trong hạt nhân. Các diễn đàn ở Kaggle rất hữu ích khi mọi người thảo luận về việc sử dụng các mô hình khác nhau cho một vấn đề và cách tiếp cận của họ.