Sách toán cho người mới bắt đầu học máy


14

Tôi là một kỹ sư Khoa học Máy tính không có nền tảng về thống kê hoặc toán nâng cao.

Tôi đang nghiên cứu cuốn sách Python Machine Learning của Raschka và Mirjalili, nhưng khi tôi cố gắng hiểu toán học của Machine Learning, tôi không thể hiểu được cuốn sách tuyệt vời mà một người bạn gợi ý cho tôi Các yếu tố của học thống kê .

Bạn có biết bất kỳ số liệu thống kê và sách toán dễ dàng hơn cho Machine Learning không? Nếu bạn không, tôi nên di chuyển như thế nào?


Tôi có bằng Bsc về thống kê và hiện đang theo học chương trình thạc sĩ trực tuyến về Khoa học dữ liệu với Simplilearn ... để trở thành một nhà khoa học dữ liệu cần có một nền tảng vững chắc về thống kê ... bởi vì hầu hết các mô hình học máy đều xây dựng trên Toán học và Số liệu thống kê được dạy ở cấp độ hoặc tốt hơn ... lời khuyên của tôi là đọc Cẩm nang khoa học dữ liệu với python ... gửi email cho tôi trên pchiita @ gmail ... để tôi có thể chia sẻ tài liệu của mình trên ổ đĩa google. .. tôi có rất nhiều sách hay ... học tập vui vẻ ....
Paul Chiita

Câu trả lời:


8

Mặc dù bạn cần sách, tôi khuyên bạn nên sử dụng các khóa học sau đây để hiểu số liệu thống kê được sử dụng cho học máy và các nhiệm vụ khác trong khoa học dữ liệu. Họ được tự do.

Nếu tôi muốn giới thiệu một cuốn sách, tôi muốn giới thiệu cuốn sách sau đây miễn phí theo giấy phép CC . Nó có những ví dụ hay và rất thiết thực; hơn nữa, có rất nhiều mã trong đó giúp bạn cảm thấy thống kê trong các ví dụ thực tế.

Ngoài ra liên kết sau đây có thể giúp:


Cảm ơn vi đa trả lơi. Nhưng tôi thích sách hơn, bạn có gợi ý nào không?
Tantaros

@Tantaros Tôi đã cập nhật câu trả lời
Truyền thông

Đã thêm một liên kết khác ..
Aditya

những gì về đại số tuyến tính, tính toán, vv? Tôi chưa luyện toán từ khi còn học trung học, nên về cơ bản tôi bắt đầu từ đầu. Tuy nhiên, tôi đã lập trình được một lúc. Có một danh sách gần đây về các loại toán học khác nhau cần ML cho năm 2018/2019 không?! cảm ơn
oldboy

Trong coursera, có một chuyên môn. Tôi không nhớ tên chính xác của nó. Nó có ba khóa học và là những gì bạn cần. Đây là toán học cho ml.
Truyền thông

2

Giới thiệu về Đại số tuyến tính https://math.mit.edu/~gs/linearacheebra / là một điểm khởi đầu tốt. Hãy chắc chắn rằng bạn giỏi với Lý thuyết Xác suất, Đại số tuyến tính và Thống kê. Một kiến ​​thức chuyên sâu có thể không cần thiết nhưng cần có kiến ​​thức tốt.


ive nghe nói rằng bệnh cần biết đại số tuyến tính, nhưng cũng tính toán? điều này có đúng không tất cả những gì tôi muốn biết là loại toán học nào là hoàn toàn cần thiết để hiểu toán học về máy học năm 2018/2019! Mọi sự trợ giúp sẽ rất được trân trọng!!
oldboy

2

Trước khi làm chủ về Analytics, tôi đã được các đàn anh đề nghị đi qua vài cuốn sách này để biết thêm về Machine Learning và Statistics.

Cụ thể là:

  1. Khám phá số liệu thống kê với SPSS / R - Andy Field
  2. R Người mới bắt đầu và R cho mọi người
  3. Phân tích dự đoán - Sức mạnh để dự đoán ai sẽ nhấp, mua, nói dối hoặc chết
  4. Khoa học dữ liệu cho doanh nghiệp và nhiều hơn nữa

Nếu bạn không thể tìm thấy những cuốn sách này trực tuyến, hãy cho tôi biết sẽ chia sẻ liên kết, tôi có chúng trên ổ đĩa của tôi. Những cuốn sách này đã giúp tôi hiểu được những điều cơ bản của số liệu thống kê với các ví dụ được giải thích bằng thuật ngữ giáo dân.

Nếu bạn đang tìm kiếm một số khóa học trực tuyến, hãy cho tôi biết có thể gợi ý cho bạn một vài khóa học tốt (hầu hết chúng đều miễn phí).


1
Hầu hết các cuốn sách có R hoặc bất kỳ công cụ sẽ không giải quyết vấn đề của mình.
dksahuji

1
Trên thực tế, lý do tại sao tôi đề nghị anh ấy cuốn sách này là, các ví dụ rất hay và dễ hiểu và tình cờ những điều đó đã được giải thích trong R nhưng R vì mọi người đã giải thích về việc thực hiện, v.v.
Toros91

@ Toros91 bạn vui lòng cung cấp các liên kết? Tôi đoán họ đáng được nhắc đến :)
Truyền thông

1
@Media hãy xem một trong những bộ sưu tập nhỏ của tôi (hiện không được duy trì) ( 1drv.ms/f/s!AhfWNelcf3iAgm5t4luUhUFal8II )
Aditya

@Aditya chắc chắn :)
Truyền thông

1

Tôi không thể nói từ câu hỏi của bạn về việc bạn giỏi toán như thế nào hoặc việc học của bạn dừng lại ở đâu. Tôi sẽ giả sử vì bạn là một kỹ sư phần mềm máy tính mà bạn quen thuộc với đại số, hình học và có lẽ là một số tính toán.

Tôi khuyên bạn nên bắt đầu việc học bằng cách đọc số liệu thống kê và hiểu các khái niệm như mô tả, phân tích dữ liệu khám phá, tương quan, phân phối, v.v. Tôi thấy rằng bạn thích sách hơn là video, vì vậy tôi sẽ gặp bạn một nửa và cung cấp cho bạn một vài cuốn sách trực tuyến, cũng như một hoặc hai cuốn sách mà bạn có thể mua in.

Đầu tiên, tôi muốn giới thiệu chương trình giảng dạy sau đại học trực tuyến của bang Pennsylvania về thống kê . Bạn có thể khám phá từng khóa học của họ bằng cách sử dụng menu bên trái. Khi bạn chọn một khóa học, cuộn xuống trên trang web của khóa học và nhấp vào liên kết có nội dung "ghi chú khóa học trực tuyến". Các ghi chú khóa học cho các khóa học này nhiều hơn ghi chú và đọc như sách đầy đủ. Họ rất hướng dẫn. Ngoài ra, hãy kiểm tra chương trình giảng dạy khóa học đại học trực tuyến của bang Pennsylvania , trong trường hợp bạn tìm thấy điều gì đó trong khóa học sau đại học quá cao cấp và muốn một lời giải thích "đơn giản hơn".

Thứ hai, xem lại Sổ tay thống kê sinh học của John H. McDonald. Đừng để tiêu đề đánh lừa bạn; cuốn sách này là một mồi tuyệt vời về thống kê và phân tích dữ liệu có thể áp dụng cho bất kỳ miền nào.

Thứ ba, xem lại Sổ tay thống kê nhỏ của Gerard Dallal. Một lần nữa, đừng để tiêu đề đánh lừa bạn; cuốn sách này là một viên ngọc khác dẫn bạn qua một số nguyên tắc thống kê quan trọng.

Thứ tư, hãy xem cuốn sách Think Stats của Allen Downey. Có phiên bản trực tuyến miễn phí của phiên bản trước đó; phiên bản gần đây nhất bạn sẽ phải mua. Mặc dù vậy, nó đáng giá, đặc biệt nếu bạn làm việc với Python. Trong cuốn sách này, tác giả dạy bạn thống kê và phân tích dữ liệu bằng Python để phân tích các bộ dữ liệu trong thế giới thực (đồ chơi). Đây là một cuốn sách thực sự tuyệt vời để làm việc thông qua.

Cuối cùng, hãy xem Khoa học dữ liệu từ đầu của Joel Grus. Cuốn sách này tập trung nhiều hơn vào phân tích dữ liệu (thay vì các nguyên tắc cơ bản thống kê) và chú trọng nhiều hơn vào học máy và mô hình hóa. Nó sử dụng Python (và ngăn xếp khoa học dữ liệu Python) để hướng dẫn bạn phân tích và tiến hành phân tích dự đoán trên các bộ dữ liệu trong thế giới thực (đồ chơi). Một cuốn sách tuyệt vời để làm việc thông qua.


1

Hãy nhớ rằng trong khi tôi có bằng Thạc sĩ về Thống kê Ứng dụng, tôi sẽ cung cấp cho bạn một câu trả lời rất đơn giản: tham gia một khóa học về xác suất.

Hầu hết các khung lập trình ML hiện đại lấy phần lớn toán học ra khỏi khoa học dữ liệu; bạn thực sự sẽ không cần nó trong hầu hết các kịch bản. Nhưng bạn sẽ luôn cần khả năng hiểu kết quả của mình và phần lớn kết quả được thể hiện bằng xác suất. Nếu tôi chưa quen với khoa học dữ liệu, tôi sẽ tham gia một khóa học (ngắn gọn) về xác suất, tìm cách hiểu tỷ lệ và tỷ lệ phần trăm thực sự có ý nghĩa gì và sau đó tôi sẽ thực sự biết một khung (như Tensorflow) thực sự tốt. Nếu bạn có thể làm điều đó, bạn có thể viết một số thuật toán thực sự thú vị và không phải ám ảnh về toán học.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.