Tôi thấy Lập trình trí tuệ tập thể là cuốn sách dễ nhất cho người mới bắt đầu, vì tác giả Toby Segaran tập trung vào việc cho phép nhà phát triển phần mềm trung bình có thể làm bẩn tay mình bằng cách hack dữ liệu nhanh nhất có thể.
Chương điển hình: Vấn đề dữ liệu được mô tả rõ ràng, theo sau là một lời giải thích sơ bộ về cách thức hoạt động của thuật toán và cuối cùng cho thấy cách tạo ra một số hiểu biết chỉ với một vài dòng mã.
Việc sử dụng python cho phép người ta hiểu mọi thứ khá nhanh (bạn không cần biết python, nghiêm túc, tôi cũng không biết điều đó trước đây). KHÔNG nghĩ rằng cuốn sách này chỉ tập trung vào việc tạo ra hệ thống đề xuất. Nó cũng liên quan đến khai thác văn bản / lọc thư rác / tối ưu hóa / phân cụm / xác nhận, v.v. và do đó cung cấp cho bạn một cái nhìn tổng quan gọn gàng về các công cụ cơ bản của mọi công cụ khai thác dữ liệu.
Chương 10 thậm chí đề cập đến dữ liệu thị trường chứng khoán, nhưng trọng tâm không phải là khai thác dữ liệu theo chuỗi thời gian. Có lẽ nhược điểm duy nhất (cho bạn) của cuốn sách tuyệt vời này.