Máy học sách dạy nấu ăn / thẻ tham khảo / áo choàng?


57

Tôi thấy các tài nguyên như Sổ tay xác suất và thống kêThẻ tham chiếu R cho khai thác dữ liệu vô cùng hữu ích. Họ rõ ràng phục vụ tốt như tài liệu tham khảo nhưng cũng giúp tôi sắp xếp suy nghĩ của mình về một chủ đề và có được vị trí của đất.

Q: Có bất cứ thứ gì như những tài nguyên này tồn tại cho các phương pháp học máy không?

Tôi đang tưởng tượng một thẻ tham chiếu cho mỗi phương thức ML sẽ bao gồm:

  • Thuộc tính chung
  • Khi phương pháp hoạt động tốt
  • Khi phương pháp làm kém
  • Từ đó hoặc phương pháp khác mà phương pháp tổng quát hóa. Nó đã được thay thế chủ yếu?
  • Giấy tờ về phương pháp
  • Các vấn đề mở liên quan đến phương pháp
  • Cường độ tính toán

Tất cả những điều này có thể được tìm thấy với một số đào tối thiểu thông qua sách giáo khoa Tôi chắc chắn. Nó sẽ chỉ thực sự thuận tiện để có chúng trên một vài trang.


5
Một mục tiêu tốt đẹp, nhưng "đào tối thiểu qua một số sách giáo khoa"? Làm thế nào người ta thậm chí có thể bắt đầu nén 20 cuốn sách này để học thống kê và khai thác dữ liệu + mloss.org/software/rating ?
chối


2
(+1) cho chuzpa, nếu một cái nhìn tổng quan như vậy tồn tại, tôi sẽ trả tiền cho nó. Vấn đề chính là bên cạnh một số thuộc tính có thể xuất phát từ chính thuật toán, phần lớn các thuộc tính hoặc quy tắc của ngón tay cái đó có được nhờ kinh nghiệm, tức là ứng dụng. Tôi khá chắc chắn rằng một nhà nghiên cứu ứng dụng cứng rắn hoặc nhà lập trình / tư vấn viên ML-framework có thể viết một cái gì đó như thế ... nhưng ở đây và bây giờ?
steffen

@Denis: liên kết "20 cuốn sách .." không hoạt động, bạn có thể kiểm tra điều này không?
lmsasu

6
Tôi không phải là chuyên gia về máy học nên tôi sẽ trì hoãn để người khác đăng câu trả lời nhưng tôi nghĩ rằng Yếu tố học tập thống kê được coi là một văn bản hay về chủ đề này và được viết bởi một số tên tuổi lớn nhất trong lĩnh vực này. Tôi nên nói thêm rằng cuốn sách này được viết ở cấp độ cao và những người tôi từng nghe khuyên rằng nó đã có bằng tiến sĩ về thống kê.
Macro

Câu trả lời:


25

Một số tài nguyên tốt nhất và miễn phí có sẵn là:

Đối với câu hỏi của tác giả, tôi chưa gặp giải pháp "Tất cả trong một trang"


Sergey, cuốn sách của Barber có liên quan đến Matlab không?
chối

2
Có, chỉ cần xem liên kết của cuốn sách: Hộp BRMLtool được cung cấp để giúp người đọc thấy cách các mô hình toán học chuyển thành mã MAT-LAB thực tế.
Serge

31

Nếu bạn muốn học Machine Learning, tôi khuyên bạn nên đăng ký khóa học ML trực tuyến miễn phí vào mùa đông do Giáo sư Andrew Ng .

Tôi đã làm cái trước đó vào mùa thu và tất cả các tài liệu học tập đều có chất lượng đặc biệt và hướng đến các ứng dụng thực tế, và dễ dàng hơn rất nhiều để tự mình vật lộn với một cuốn sách.

Nó cũng tạo ra một quả treo khá thấp với những giải thích trực quan tốt và lượng toán tối thiểu.


Tôi vừa hoàn thành khóa học này và nó thật tuyệt vời! Ngoài ra, nó đã cho tôi một khởi đầu tuyệt vời để hiểu những cuốn sách về học máy.
B Bảy

1
Tôi nghĩ rằng liên kết này bây giờ là coursera.org/c thuyết / ml
n611x007

14

Vâng, bạn ổn; "Nhận dạng mẫu và học máy" của Christopher Bishop là một cuốn sách tuyệt vời để tham khảo chung, bạn thực sự không thể sai với nó.

Một cuốn sách khá gần đây nhưng cũng được viết rất hay và không kém phần rộng rãi là " Lý luận Bayes và Học máy " của David Barber ; một cuốn sách tôi sẽ cảm thấy phù hợp hơn một chút cho một người mới đến trong lĩnh vực này.

Tôi đã sử dụng "Các yếu tố của học thống kê" từ Hastie et al. (được đề cập bởi Macro) và trong khi một cuốn sách rất mạnh, tôi sẽ không đề xuất nó như một tài liệu tham khảo đầu tiên; có lẽ nó sẽ phục vụ bạn tốt hơn như một tài liệu tham khảo thứ hai cho các chủ đề chuyên sâu hơn. Trong khía cạnh đó, cuốn sách, Lý thuyết thông tin, suy luận và thuật toán học tập của David MacKay cũng có thể làm một công việc tuyệt vời.


2
+1 cho Giám mục. Phát triển rõ ràng với một mức độ chi tiết thậm chí. Trong khi vẫn còn tốt, tôi luôn luôn tìm thấy Hastie et al. một chút choppy.
liên hợp chiến binh

1
+1 - Hastie, Tibshirani và Friedman là sở thích cá nhân của tôi.
StasK

1
+1 cũng vì đã giới thiệu Hastie, Tibshirani và Friedman, sở thích cá nhân của tôi cũng vậy. Và cảm ơn về các khuyến nghị khác; Tôi sẽ cho họ đọc vì tôi thực sự cần một cuốn sách hay để giới thiệu cho những người không theo thống kê (hoặc những người mới tham gia vào lĩnh vực này).
Néstor

1
+1 cho Giám mục. Nó thực sự là một nguồn tuyệt vời cho các số liệu thống kê cổ điển, nhưng được cập nhật và ngụy trang.
phỏng đoán

10

Vì sự đồng thuận dường như là câu hỏi này không phải là một bản sao, tôi muốn chia sẻ yêu thích của tôi cho người mới bắt đầu học máy:

Tôi thấy Lập trình trí tuệ tập thể là cuốn sách dễ nhất cho người mới bắt đầu, vì tác giả Toby Segaran tập trung vào việc cho phép nhà phát triển phần mềm trung bình làm cho bàn tay của mình bị bẩn với việc hack dữ liệu nhanh nhất có thể.

Chương điển hình: Vấn đề dữ liệu được mô tả rõ ràng, theo sau là một lời giải thích sơ bộ về cách thức hoạt động của thuật toán và cuối cùng cho thấy cách tạo ra một số hiểu biết chỉ với một vài dòng mã.

Việc sử dụng python cho phép người ta hiểu mọi thứ khá nhanh (bạn không cần biết python, nghiêm túc, tôi cũng không biết điều đó trước đây). KHÔNG nghĩ rằng cuốn sách này chỉ tập trung vào việc tạo ra hệ thống đề xuất. Nó cũng liên quan đến khai thác văn bản / lọc thư rác / tối ưu hóa / phân cụm / xác nhận, v.v. và do đó cung cấp cho bạn một cái nhìn tổng quan gọn gàng về các công cụ cơ bản của mọi công cụ khai thác dữ liệu.


6

Witten và Frank, "Khai thác dữ liệu", Elsevier 2005 là một cuốn sách hay để tự học vì có một thư viện mã Java (Weka) để đi cùng với cuốn sách và được định hướng rất thực tế. Tôi nghi ngờ có một phiên bản gần đây hơn phiên bản tôi có.


1
Đúng, cuốn sách này được gọi là "Machine Learning" nhưng tên đã được các nhà xuất bản đổi thành "Khai thác dữ liệu" để quảng cáo khai thác dữ liệu vào thời điểm đó, tuy nhiên cuốn sách nói về ML không phải DM (hai điểm tương đồng hoàn toàn, nhưng là các lĩnh vực khác nhau!).
clyfe

1
Cuốn sách "Machine Learning" của Tom Mitchell cũng rất hay; phong cách là một chút lỗi thời, nhưng nội dung là tuyệt vời.
Dikran Marsupial

Vâng, ML của Tom Mitchell giống như kinh thánh ML, thực sự toàn diện trên sân!
clyfe


5

"Các yếu tố của học thống kê" sẽ là một cuốn sách tuyệt vời cho mục đích của bạn. Ấn bản thứ 5 của cuốn sách, được xuất bản vào đầu năm 2011, được phát hành miễn phí tại http://www.stanford.edu/~hastie/local.ftp/Springer/ESLII_print5.pdf


2
Đó là cuốn sách nặng về toán học, do đó người học có thể khó theo dõi.
Atilla Ozgur

Bạn có biết làm thế nào để nó có thể tải xuống miễn phí trên các trang cá nhân của Trevor Hastie khi Springer tính phí 70 đô la cho nó không?
Alfred M.

Tôi không biết chắc chắn, nhưng tôi sẽ tưởng tượng Springer muốn có tiền và các tác giả chủ yếu muốn công khai rộng rãi cuốn sách của họ. Điều này có vẻ rất giống với cách Springer sẽ bán cho bạn các bài báo được xuất bản trong khi nhiều "phiên bản giấy làm việc" được cung cấp miễn phí trên trang web của tác giả.
DanB

FYI, bản tải xuống dành cho lần in thứ 5 của phiên bản thứ hai. Tôi yêu phần chú thích cho bản tin điện tử "Trong Chúa chúng tôi tin tưởng, tất cả những người khác mang dữ liệu" được quy cho Deming. Các chú thích chỉ ra điều trớ trêu rằng không có "dữ liệu" nào có thể được tìm thấy xác nhận Deming thực sự nói điều này.
HeatfanJohn

Bạn nên đề cập đến Giới thiệu về Học thống kê với R --it là loại giống như họ ESL -lite (nếu toán trong ESL là quá khó khăn).
Steve S

5

nhập mô tả hình ảnh ở đây

Thường thì phần khó nhất trong việc giải quyết vấn đề máy học có thể là tìm ra công cụ ước tính phù hợp cho công việc. Các công cụ ước tính khác nhau phù hợp hơn cho các loại dữ liệu khác nhau và các vấn đề khác nhau. Lưu đồ dưới đây được thiết kế để cung cấp cho người dùng một chút hướng dẫn sơ bộ về cách tiếp cận các vấn đề liên quan đến công cụ ước tính nào để thử dữ liệu của bạn. Nhấp vào bất kỳ công cụ ước tính nào trong biểu đồ bên dưới để xem tài liệu của nó.



3

Hầu hết các cuốn sách được đề cập trong các câu trả lời khác đều rất hay và bạn không thể thực sự sai với bất kỳ cuốn sách nào. Ngoài ra, tôi thấy bảng cheat sau đây cho Python scikit-learnkhá hữu ích.


2

Tôi thích Duda, Hart và Cò "Phân loại mẫu". Đây là một phiên bản gần đây của một văn bản cổ điển giải thích mọi thứ rất tốt. Không chắc chắn rằng nó được cập nhật để có nhiều vùng phủ sóng của các mạng thần kinh và SVM. Cuốn sách của Hastie, Tibshirani và Friedman là về cuốn sách hay nhất nhưng có thể có một chút kỹ thuật hơn những gì bạn đang tìm kiếm và chi tiết hơn là một cái nhìn tổng quan về chủ đề này.


2

Microsoft Azure cũng cung cấp một cheat-sheet tương tự như scikit-learn được đăng bởi Anton Tarasenko.

Bảng điểm thuật toán học máy Microsoft Azure

(nguồn: https://docs.microsoft.com/en-us/azure/machine-learning/machine-learning-alerskym-cheat-sheet )

Họ đi kèm với nó với một thông báo:

Các đề xuất được đưa ra trong bảng cheat thuật toán này là các quy tắc gần đúng. Một số có thể bị uốn cong, và một số có thể bị vi phạm một cách trắng trợn. Điều này nhằm mục đích đề xuất một điểm khởi đầu. (...)

Microsoft cũng cung cấp một bài viết giới thiệu cung cấp thêm thông tin chi tiết.

Xin lưu ý rằng các tài liệu đó được tập trung vào các phương thức được triển khai trong Microsoft Azure.


1

Đừng bắt đầu với các yếu tố của học thống kê. Nó là tuyệt vời, nhưng nó là một cuốn sách tham khảo, không giống như những gì bạn đang tìm kiếm. Tôi sẽ bắt đầu với Lập trình trí tuệ tập thể vì nó dễ đọc.


Tôi không chắc chắn tôi sẽ mô tả ESL như một văn bản tham khảo. Nó có vẻ như là một cái nhìn tổng quan hơn đối với tôi, tức là bạn sẽ không tìm hiểu các chi tiết khó chịu về nitty của (hầu như) bất cứ điều gì. Bạn sẽ thấy các kỹ thuật rộng lớn và các chủ đề bao quát.
Đức hồng y

1

Đối với một cuốn sách đầu tiên về học máy, làm tốt công việc giải thích các nguyên tắc, tôi rất muốn giới thiệu

Rogers và Girolami, Khóa học đầu tiên về học máy , (Chapman & Hall / CRC Machine Learning & Pattern Recognition), 2011.

Cuốn sách của Chris Bishop, hoặc David Barber đều đưa ra những lựa chọn tốt cho một cuốn sách có chiều rộng lớn hơn, một khi bạn nắm vững các nguyên tắc.




0

Một chiếc áo choàng tốt là một trong cuốn sách Max Kuhn Ứng dụng Mô hình dự đoán . Trong cuốn sách có một bảng tóm tắt tốt về một số mô hình học tập ML. Bảng nằm trong phụ lục A trang 549.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.