Sách để đọc trước các yếu tố của học thống kê?


50

Dựa trên bài đăng này , tôi muốn tiêu hóa các yếu tố của học thống kê. May mắn là nó có sẵn miễn phí và tôi bắt đầu đọc nó.

Tôi không có đủ kiến ​​thức để hiểu nó. Bạn có thể giới thiệu một cuốn sách giới thiệu tốt hơn về các chủ đề trong cuốn sách? Hy vọng một cái gì đó sẽ cung cấp cho tôi kiến ​​thức cần thiết để hiểu nó?

Liên quan:

Là một nền tảng mạnh mẽ trong toán học là một điều cần thiết cho ML?


12
Tôi thấy Đại số tuyến tính của Strang và các ứng dụng của nó cực kỳ hữu ích trong việc tìm hiểu các thao tác ma trận tạo thành một phần lớn của các yếu tố.
richiemorrisroe

Câu trả lời:


18

Tôi đã mua, nhưng chưa đọc,

S. Marsland, Học máy: Một viễn cảnh thuật toán , Chapman & Hall, 2009.

Tuy nhiên, các đánh giá là thuận lợi và nói rằng nó phù hợp cho người mới bắt đầu hơn các sách ML khác có chiều sâu hơn. Lật qua các trang, có vẻ như tôi tốt cho tôi vì tôi có ít nền tảng toán học.


Trông thật tuyệt - rất dễ tiếp cận.
B Bảy

Tôi đã tải xuống và đọc "mẫu" - tất cả 19 trang (wow). Nó dễ hiểu hơn nhiều so với các yếu tố của học thống kê. Chắc chắn dường như là những gì tôi đang tìm kiếm. Cảm ơn.
B Bảy

4
Tôi đã thực hiện các chỉnh sửa cho câu hỏi của bạn để cung cấp một trích dẫn cho cuốn sách. Nói chung, việc đặt những câu như "Tôi thích cái này " trong một câu trả lời là không được khuyến khích vì nếu liên kết bị phá vỡ, sẽ không ai biết "cái này" đang đề cập đến cái gì. Chúc mừng.
Đức Hồng Y

Tôi mới nhận được nó và bắt đầu đọc nó (75 trang đầu tiên). Thật là tuyệt vời Rất dễ hiểu, nhưng đủ chi tiết để thiết thực và hữu ích. Rất khuyến khích cho bất cứ ai muốn sử dụng Machine Learning. Chính xác những gì tôi đang tìm kiếm. Cảm ơn!
B Bảy

39

Các tác giả của Yếu tố học tập thống kê đã đưa ra một cuốn sách mới (tháng 8 năm 2013) nhắm đến người dùng không có nền tảng toán học nặng. Giới thiệu về Học thống kê: với các ứng dụng trong R

Phiên bản PDF miễn phí của cuốn sách này hiện có thể được tìm thấy ở đây .


Tôi sẽ đề xuất điều này kể từ khi phát hành gần đây và rõ ràng có liên quan mạnh mẽ đến văn bản khách quan của người đăng. Đề nghị tốt.
Chris Simokat

3
Vẫn tốt hơn, các tác giả đã thông báo rằng một bản pdf trực tuyến miễn phí của cuốn sách này sẽ có sẵn từ tháng 1 năm 2013 (nó đang được sử dụng trong một MOOC mà họ đang chạy.)
Flounderer

16

Tôi thấy Lập trình trí tuệ tập thể là cuốn sách dễ nhất cho người mới bắt đầu, vì tác giả Toby Segaran tập trung vào việc cho phép nhà phát triển phần mềm trung bình có thể làm bẩn tay mình bằng cách hack dữ liệu nhanh nhất có thể.

Chương điển hình: Vấn đề dữ liệu được mô tả rõ ràng, theo sau là một lời giải thích sơ bộ về cách thức hoạt động của thuật toán và cuối cùng cho thấy cách tạo ra một số hiểu biết chỉ với một vài dòng mã.

Việc sử dụng python cho phép người ta hiểu mọi thứ khá nhanh (bạn không cần biết python, nghiêm túc, tôi cũng không biết điều đó trước đây). KHÔNG nghĩ rằng cuốn sách này chỉ tập trung vào việc tạo ra hệ thống đề xuất. Nó cũng liên quan đến khai thác văn bản / lọc thư rác / tối ưu hóa / phân cụm / xác nhận, v.v. và do đó cung cấp cho bạn một cái nhìn tổng quan gọn gàng về các công cụ cơ bản của mọi công cụ khai thác dữ liệu.

Chương 10 thậm chí đề cập đến dữ liệu thị trường chứng khoán, nhưng trọng tâm không phải là khai thác dữ liệu theo chuỗi thời gian. Có lẽ nhược điểm duy nhất (cho bạn) của cuốn sách tuyệt vời này.


Nó có sẵn trên Safari Sách trực tuyến safaribooksonline.com . Cảm ơn.
B Bảy

1
Có cuốn sách này và bắt đầu làm việc thông qua nó. Nó rất thực tế. Trong 18 trang đầu tiên, bạn triển khai một công cụ đề xuất (cơ bản) hoàn chỉnh.
B Bảy

Wow, cuốn sách này thực sự đáng kinh ngạc. Nó dạy cho bạn cách triển khai tất cả các loại thuật toán Machine Learning chỉ với một ít mã Python. Một trong những cuốn sách thiết thực nhất từ ​​trước đến nay. Hạn chế duy nhất là Python đã được cập nhật kể từ khi cuốn sách được xuất bản. Nó cũng sử dụng nhiều API cũng đã thay đổi. Vì vậy, tôi không nghĩ rằng các ví dụ sẽ hoạt động mà không cần chỉnh sửa.
B Bảy

@BSeven cảm ơn bạn, không biết điều đó. Tôi không chắc chắn liệu tôi thích một cuốn sách sử dụng các thư viện có sẵn (thường là một thứ có thể) hoặc mã riêng của nó (hoạt động cho tất cả các ví dụ về sách nhưng có thể kém mạnh mẽ hơn do ít người dùng hơn).
steffen

1
Tôi nghĩ rằng những ngày này sự lựa chọn duy nhất là các thư viện có sẵn. Chúng có mặt khắp nơi, dễ tích hợp, đa nền tảng, đa ngôn ngữ và nhanh chóng. Bên cạnh đó, nếu một cuốn sách có mã riêng, việc sửa đổi sẽ khó khăn hơn nhiều. Dễ dàng sửa đổi các cuộc gọi đến thư viện. Cảm ơn vì lời giới thiệu. Đó là một nguồn tuyệt vời.
B Bảy

13

Giới thiệu về Machine Learning , của E. Alpaydin (MIT Press, 2010, tái bản lần thứ 2), bao gồm rất nhiều chủ đề với hình minh họa đẹp (giống như Nhận dạng mẫu của Đức cha và Học máy ).

Ngoài ra, Andrew W. Moore có một số hướng dẫn tốt về Khai thác dữ liệu thống kê .


(+1) Không biết cuốn sách, nhưng các hướng dẫn của Andrew Moore rất hay (và đôi khi còn mang tính giải trí)
steffen

@steffen Tôi cũng muốn giới thiệu Phương pháp thống kê của Radford Neale cho việc học máy và khai thác dữ liệu .
chl

1
+1 Alpaydin là con đường đúng đắn. Tôi đã ở trong tình trạng giống hệt như OP vài tháng trước. Đấu tranh tồi tệ với Tibshirani, và sau đó tình cờ gặp Alpaydin và mọi thứ đã tốt hơn rất nhiều kể từ đó. Cuối cùng, mặc dù tôi nghĩ rằng Tibshirani là phải đọc.
Andy

10

Tất cả các số liệu thống kê của Mayinois Wasserman sẽ được quan tâm. Bạn có thể lấy mẫu cuốn sách từ liên kết đã cho - và chỉ một vài đoạn đầu của lời nói đầu đã bán mạnh cho thị trường của bạn - và bạn có thể tải xuống cuốn sách miễn phí qua Springer nếu bạn được liên kết với một trường đại học.

EDIT: Rất tiếc, đã không nhận thấy chủ đề này cổ xưa như thế nào.


5
Không quan trọng, việc giới thiệu vẫn hữu ích cho những người khác đọc chủ đề (như tôi; o).
Dikran Marsupial

1
Cuốn sách tuyệt vời, nhưng công bằng mà nói, nếu một người có thể đọc và hiểu tất cả các số liệu thống kê , một phần tốt của ESL là dư thừa.
usεr11852 nói Phục hồi Monic

7

Các yếu tố của học thống kê có thể là một bài đọc khó, đặc biệt đối với một người tự học. Trong khi tìm kiếm một số giải thích về chương thứ hai, tôi đã vấp phải tài nguyên sau: https://waxworksmath.com/Authors/G_M/Hastie/WriteUp/Weatherwax_Epstein_Hastie_Solution_Manual.pdf . Nó chứa hơn 100 trang chú thích và giải thích làm rõ một số khoảnh khắc phức tạp của cuốn sách. Một nguồn tuyệt vời cho tất cả mọi người đọc cuốn sách này. Văn bản bổ sung này bao gồm các giải pháp cho bài tập.


5

Tôi thực sự muốn giới thiệu một khóa học đầu tiên về học máy của Rogers và Girolami. Nó bao gồm các ý tưởng chính theo một trật tự rất logic, với các ví dụ tốt và với mức độ tối thiểu của toán học để có một nền tảng phù hợp trong các nguyên tắc cơ bản. Nó không có phạm vi bao phủ của một số cuốn sách, nhưng đó chính xác là lý do tại sao nó tốt như một văn bản giới thiệu.


Trông giống như một cuốn sách đầu tiên tốt. Và, có một phiên bản Kindle.
B Bảy

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.