Dự án khoa học dữ liệu giải thích từng bước?


10

Tôi đang tìm kiếm một trang web hoặc cuốn sách trong đó một số ví dụ thực tế được đưa ra từng bước, giải thích cách họ chọn các tính năng có liên quan, quy trình chọn mô hình, v.v ...

Câu trả lời:


2

1

Tôi đã có cùng một câu hỏi một vài tuần trước.

Cá nhân tôi thấy Python của Phân tích dữ liệu của O'Reilly rất hữu ích trong việc học những điều cơ bản. Cuốn sách giả định rằng bạn có một số kinh nghiệm lập trình python, nhưng nó cũng có một phụ lục ở phía sau để đi qua những điều cơ bản.

Tác giả cung cấp cho bạn rất nhiều ví dụ về thế giới thực (không phải Monty Python) ngay từ đầu bạn có thể tạo trong vài chương đầu tiên, sau đó đi vào chi tiết về từng điều khi cuốn sách tiếp tục, xây dựng kiến ​​thức của bạn.

Tôi tìm thấy các hướng dẫn rất dễ dàng và từng bước. Giáo sư của tôi, người hướng dẫn tôi trong tất cả những điều này đã rất ấn tượng khi tôi học nhanh.

Tôi cũng đã nghe những điều tốt về Kaggle.


1

Khoa học dữ liệu trên đám mây với Microsoft Azure Machine Learning và R là một cuốn sách giáo khoa miễn phí hoạt động thông qua một ví dụ rất chi tiết. Đừng bỏ qua các công cụ cụ thể được sử dụng vì bạn không cần chúng để nhận được một số lợi ích từ cuốn sách.

Một dự án khác mà tôi rất thích là Lập trình trí tuệ tập thể cũng trải qua một số dự án một cách chi tiết, bao gồm cả phần cào web mà hầu hết các cuốn sách đều đề cập.




0

Một trong những cuốn sách hay nhất tôi đã tìm thấy là Machine Learning in Python từ Sebastian Raschka. Ví dụ dễ dàng, giải thích từng bước và số lượng toán vừa phải.

Cấu trúc của cuốn sách bao gồm toàn bộ quá trình từ làm sạch dữ liệu đến tập hợp và đánh giá.


0

Có một cái nhìn tại:

https://www.analyticsvidhya.com/blog/2016/01/complete-tutorial-learn-data-science-python-scratch-2/

Điều này có một hướng dẫn từng bước sẽ cho bạn ý tưởng về toàn bộ quá trình Khám phá dữ liệu, Phân tích dữ liệu và Xây dựng mô hình dự đoán.

Giải thích về Khám phá dữ liệu và Kỹ thuật tính năng (cách chọn các tính năng có liên quan) có tại đây:

https://www.analyticsvidhya.com/blog/2016/01/guide-data-exploration/

Xem 5 Bộ dữ liệu đầu tiên tại đây có hướng dẫn và làm việc với chúng để có được trải nghiệm thực tế:

https://www.analyticsvidhya.com/blog/2016/10/17-ultimate-data-science-projects-to-boost-your-ledgeledge-and-skills/

Cũng có một cái nhìn tại:

http://machinelearningmastery.com/machine-learning-in-python-step-by-step/

trong đó anh ta sử dụng nhiều mô hình trên một tập dữ liệu duy nhất sẽ cho bạn hiểu mức độ cơ bản của các mô hình khác nhau.

Để hiểu thêm về lựa chọn mô hình, hãy xem điều này:

https://www.quora.com/Data-Science-How-do-Data-Sellectists-perform-model-selection

Liên kết trên có câu trả lời được đưa ra bởi những người làm việc trong lĩnh vực này.

Để hiểu rõ hơn về các bộ dữ liệu khác nhau, bạn luôn có thể đăng nhập vào kaggle và trải qua các cuộc thi và xem xét một loạt các bộ dữ liệu, nơi bạn có quyền truy cập vào mã của mọi người trong hạt nhân. Các diễn đàn ở Kaggle rất hữu ích khi mọi người thảo luận về việc sử dụng các mô hình khác nhau cho một vấn đề và cách tiếp cận của họ.

https://www.kaggle.com/

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.