Tôi không thể nói từ câu hỏi của bạn về việc bạn giỏi toán như thế nào hoặc việc học của bạn dừng lại ở đâu. Tôi sẽ giả sử vì bạn là một kỹ sư phần mềm máy tính mà bạn quen thuộc với đại số, hình học và có lẽ là một số tính toán.
Tôi khuyên bạn nên bắt đầu việc học bằng cách đọc số liệu thống kê và hiểu các khái niệm như mô tả, phân tích dữ liệu khám phá, tương quan, phân phối, v.v. Tôi thấy rằng bạn thích sách hơn là video, vì vậy tôi sẽ gặp bạn một nửa và cung cấp cho bạn một vài cuốn sách trực tuyến, cũng như một hoặc hai cuốn sách mà bạn có thể mua in.
Đầu tiên, tôi muốn giới thiệu chương trình giảng dạy sau đại học trực tuyến của bang Pennsylvania về thống kê . Bạn có thể khám phá từng khóa học của họ bằng cách sử dụng menu bên trái. Khi bạn chọn một khóa học, cuộn xuống trên trang web của khóa học và nhấp vào liên kết có nội dung "ghi chú khóa học trực tuyến". Các ghi chú khóa học cho các khóa học này nhiều hơn ghi chú và đọc như sách đầy đủ. Họ rất hướng dẫn. Ngoài ra, hãy kiểm tra chương trình giảng dạy khóa học đại học trực tuyến của bang Pennsylvania , trong trường hợp bạn tìm thấy điều gì đó trong khóa học sau đại học quá cao cấp và muốn một lời giải thích "đơn giản hơn".
Thứ hai, xem lại Sổ tay thống kê sinh học của John H. McDonald. Đừng để tiêu đề đánh lừa bạn; cuốn sách này là một mồi tuyệt vời về thống kê và phân tích dữ liệu có thể áp dụng cho bất kỳ miền nào.
Thứ ba, xem lại Sổ tay thống kê nhỏ của Gerard Dallal. Một lần nữa, đừng để tiêu đề đánh lừa bạn; cuốn sách này là một viên ngọc khác dẫn bạn qua một số nguyên tắc thống kê quan trọng.
Thứ tư, hãy xem cuốn sách Think Stats của Allen Downey. Có phiên bản trực tuyến miễn phí của phiên bản trước đó; phiên bản gần đây nhất bạn sẽ phải mua. Mặc dù vậy, nó đáng giá, đặc biệt nếu bạn làm việc với Python. Trong cuốn sách này, tác giả dạy bạn thống kê và phân tích dữ liệu bằng Python để phân tích các bộ dữ liệu trong thế giới thực (đồ chơi). Đây là một cuốn sách thực sự tuyệt vời để làm việc thông qua.
Cuối cùng, hãy xem Khoa học dữ liệu từ đầu của Joel Grus. Cuốn sách này tập trung nhiều hơn vào phân tích dữ liệu (thay vì các nguyên tắc cơ bản thống kê) và chú trọng nhiều hơn vào học máy và mô hình hóa. Nó sử dụng Python (và ngăn xếp khoa học dữ liệu Python) để hướng dẫn bạn phân tích và tiến hành phân tích dự đoán trên các bộ dữ liệu trong thế giới thực (đồ chơi). Một cuốn sách tuyệt vời để làm việc thông qua.