Làm thế nào để bắt đầu đọc về khai thác dữ liệu?


13

Tôi là một người mới sẽ bắt đầu đọc về khai thác dữ liệu. Tôi có kiến ​​thức cơ bản về AI và thống kê. Vì nhiều người nói rằng học máy cũng đóng một vai trò quan trọng trong khai thác dữ liệu, có cần phải đọc về học máy trước khi tôi có thể tiếp tục với khai thác dữ liệu không?


Câu trả lời:


12

Trở thành một phần trong vị trí này, tôi sẽ cố gắng đưa ra một cái nhìn sâu sắc.

Đầu tiên, tải về các yếu tố của học thống kê . Nó giả định tính toán và đại số tuyến tính, và mặc dù nó rất kỹ thuật, nó cũng được viết rất tốt.

Thứ hai (hoặc trước hết) nhìn vào hướng dẫn của Andrew Ng về học máy.

Thứ ba, có được một số dữ liệu và bắt đầu cố gắng phân tích dữ liệu. Bạn sẽ cần chia thành các tập huấn luyện và kiểm tra, sau đó xây dựng các mô hình trên tập huấn luyện và kiểm tra chúng theo tập kiểm thử. Tôi thấy gói caret cho R rất hữu ích cho tất cả những điều này. Sau đó, thực hành của nó, thực hành thực hành (như hầu hết mọi thứ khác).


1
bạn sẽ sợ người đàn ông nghèo mãi mãi!
Neil McGuigan

Khóa học của Andew Ng sẽ được 'cung cấp miễn phí và trực tuyến' cho toàn thế giới của sinh viên trong mùa thu năm 2011 theo ml- class.org
Andre Holzner


4

Khai thác dữ liệu có thể được mô tả hoặc dự đoán.

Một mặt, nếu bạn quan tâm đến việc khai thác dữ liệu mô tả, thì học máy sẽ không giúp ích gì.

kn

  • kn
  • knn

3
k/n Phương pháp thống kê cho học máy và khai thác dữ liệu : Nhiều vấn đề về máy học có số lượng biến lớn, các ứng dụng khai thác dữ liệu thường liên quan đến số lượng rất lớn các trường hợp.
chl

3

Tôi chỉ thêm một nguồn hướng dẫn rất tốt khác về khai thác dữ liệu / học máy của Tom Mitchell .

Anh ấy giải thích rất rõ ràng và Bạn cũng có thể tải xuống các bài thuyết trình của mình từ trang web của anh ấy (cùng với việc xem các bài giảng của anh ấy ở đó).

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.