Một số ứng dụng học máy dễ học là gì? [đóng cửa]


12

Là người mới đối với học máy nói chung, tôi muốn bắt đầu chơi xung quanh và xem khả năng là gì.

Tôi tò mò về những ứng dụng bạn có thể đề xuất sẽ cung cấp thời gian nhanh nhất từ ​​khi cài đặt đến tạo ra một kết quả có ý nghĩa.

Ngoài ra, bất kỳ đề xuất nào cho các tài liệu bắt đầu tốt về chủ đề học máy nói chung sẽ được đánh giá cao.


Ngoài việc học Machine Learning của Andrew Ng, bạn có thể thử với một số khóa học về chữ ký khoa học dữ liệu trong kaggle. Ngoài ra, một cách nhanh chóng để học máy học thực tế là tham gia cuộc thi học máy tại kaggle, vì đó là tài liệu hướng dẫn tuyệt vời về cách thực hiện lựa chọn tính năng, trộn dữ liệu và xây dựng mô hình cuối cùng trong R và trong Python. kaggle.com/c/titanic/details/getting-started-with-python
0xF

Câu trả lời:


13

Tôi khuyên bạn nên bắt đầu với một số MOOC về học máy. Ví dụ khóa học của Andrew Ng tại coursera.

Bạn cũng nên xem qua ứng dụng Orange . Nó có giao diện đồ họa và có lẽ dễ hiểu hơn một số kỹ thuật ML sử dụng nó.


5
+1 Đối với khóa học của Andrew Ng. Nó được thực hiện rất tốt.
TylerAndFriends

1
John Hopkins cũng có một ca khúc chứng chỉ khoa học dữ liệu (9 lớp) bắt đầu vào tuần trước tại Coursera. coursera.org/specialization/jhudatascience/ ' - nó không phải là tất cả học máy, nhưng đáng để chia sẻ. Coursera đầy sự tuyệt vời (và Andrew Ng là một giảng viên tuyệt vời).
Steve Kallestad

11

Thành thật mà nói, tôi nghĩ rằng làm một số dự án sẽ dạy cho bạn nhiều hơn là làm một khóa học đầy đủ. Một lý do là làm một dự án có nhiều động lực và kết thúc mở hơn là làm bài tập.

Một khóa học, nếu bạn có thời gian VÀ động lực (động lực thực sự), tốt hơn là thực hiện một dự án. Các nhà bình luận khác đã đưa ra khuyến nghị nền tảng tốt về công nghệ.

Tôi nghĩ, từ quan điểm dự án thú vị, bạn nên đặt câu hỏi và lấy máy tính để học cách trả lời nó.

Một số câu hỏi cổ điển tốt có ví dụ hay là:

  • Mạng nơ-ron để nhận dạng chữ số viết tay
  • Phân loại email spam bằng cách sử dụng hồi quy logistic
  • Phân loại đối tượng bằng mô hình hỗn hợp Gaussian
  • Một số sử dụng hồi quy tuyến tính, có lẽ dự báo giá hàng tạp hóa cho các khu phố

Các dự án này có toán học được thực hiện, mã được thực hiện và có thể tìm thấy với Google một cách dễ dàng.

Các môn học tuyệt vời khác có thể được thực hiện bởi bạn!

Cuối cùng, tôi nghiên cứu về robot, vì vậy đối với tôi, hầu hết các ứng dụng FUN là hành vi. Ví dụ có thể bao gồm (nếu bạn có thể chơi với một arduino)

Tạo một ứng dụng, có thể sử dụng hồi quy logistic, có thể biết khi nào nên tắt quạt và bật nhiệt độ bên trong và trạng thái của ánh sáng trong phòng.

Tạo một ứng dụng dạy robot di chuyển bộ truyền động, có thể là bánh xe, dựa trên đầu vào cảm biến (có thể là nhấn nút), sử dụng Mô hình hỗn hợp Gaussian (học từ trình diễn).

Dù sao, đó là khá tiên tiến. Điểm tôi đang làm là nếu bạn chọn một dự án mà bạn (thực sự thực sự) thích và dành một vài tuần cho nó, bạn sẽ học được một lượng lớn và hiểu được nhiều hơn bạn sẽ làm một vài bài tập.


5

Tôi nghĩ Weka là một điểm khởi đầu tốt. Bạn có thể thực hiện một loạt các công cụ như học tập có giám sát hoặc phân cụm và dễ dàng so sánh một tập hợp lớn các phương pháp thuật toán na.

Hướng dẫn của Weka thực sự là một cuốn sách về học máy và khai thác dữ liệu có thể được sử dụng làm tài liệu giới thiệu.


2

Giả sử bạn đã quen thuộc với lập trình, tôi sẽ khuyên bạn nên xem scikit-learn . Nó có các trang trợ giúp đặc biệt tốt có thể phục vụ như hướng dẫn nhỏ / tham quan nhanh thông qua học máy. Chọn một khu vực bạn thấy thú vị và làm việc thông qua các ví dụ.




2

Nếu bạn có thể tái tạo lưới biểu đồ 6x3 từ biểu ngữ của http://scikit-learn.org/ trang thì bạn sẽ học được một số ML và một số Python. Bạn đã không đề cập đến một ngôn ngữ. Python đủ dễ để học rất nhanh và scikit-learn có một loạt các thuật toán được triển khai.

Sau đó thử dữ liệu của riêng bạn!


1

Ngoài các khóa học và hướng dẫn được đăng, tôi sẽ gợi ý thêm một chút 'tận tay': Kaggle có một số cuộc thi giới thiệu có thể khơi gợi sự quan tâm của bạn (hầu hết mọi người bắt đầu với cuộc thi Titanic). Và có rất nhiều đối tượng để khám phá và cạnh tranh khi bạn muốn có thêm kinh nghiệm.


1

Như đã đề cập trong các câu trả lời ở trên nắm bắt những điều cơ bản của ML bằng cách làm theo MOOCs của Prof.Andrew Ng và 'Học từ dữ liệu' của Giáo sư Yaser Abu-Mostafa.

R là người chiến thắng rõ ràng là công cụ được sử dụng nhiều nhất trong các cuộc thi Kaggle. (Đừng quên kiểm tra tài nguyên trên wiki và diễn đàn Kaggle)

Học R và Python cơ bản. Ca khúc 'Khoa học dữ liệu' của Coursera có khóa học R giới thiệu . Hầu như tất cả các thuật toán có thể được tìm thấy trong các thư viện Python và R. Hãy sử dụng các thuật toán bạn đã học trong một vài cuộc thi kaggle. Là một điểm khởi đầu so sánh hiệu suất của một số thuật toán trên bộ dữ liệu Titanic và bộ dữ liệu nhận dạng Digit trên kaggle .

Và tiếp tục thực hành trên các bộ dữ liệu khác nhau!

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.