Những cuốn sách cung cấp một cái nhìn tổng quan về thống kê tính toán khi nó áp dụng cho khoa học máy tính?


15

Là một kỹ sư phần mềm, tôi quan tâm đến các chủ đề như thuật toán thống kê, khai thác dữ liệu, học máy, mạng Bayes, thuật toán phân loại, mạng thần kinh, chuỗi Markov, phương pháp Monte Carlo và tạo số ngẫu nhiên.

Cá nhân tôi không có hứng thú làm việc với bất kỳ kỹ thuật nào trong số này, nhưng tôi đã phải làm việc với phần mềm, dưới mui xe, sử dụng chúng và muốn biết thêm về chúng, ở mức độ cao. Tôi đang tìm kiếm những cuốn sách bao quát một bề rộng lớn - độ sâu lớn là không cần thiết vào thời điểm này. Tôi nghĩ rằng tôi có thể học được rất nhiều về phát triển phần mềm nếu tôi có thể hiểu được nền tảng toán học đằng sau các thuật toán và kỹ thuật được sử dụng.

Cộng đồng Phân tích Thống kê có thể giới thiệu những cuốn sách mà tôi có thể sử dụng để tìm hiểu thêm về việc triển khai các yếu tố thống kê khác nhau trong phần mềm không?

Câu trả lời:




3

Đây là một cuốn sách rất hay từ James E. Gentle, Thống kê tính toán (Springer, 2009), bao gồm cả khía cạnh tính toán và thống kê của phân tích dữ liệu. Gentle cũng là tác giả của những cuốn sách tuyệt vời khác, kiểm tra ấn phẩm của mình.

Một cuốn sách tuyệt vời là Sổ tay tính toán thống kê , từ Gentle et al. (Mùa xuân, 2004); nó được lưu hành dưới dạng PDF ở đâu đó trên web, vì vậy hãy thử xem nó trên Google.


2

Bạn đã đề cập đến một số kỹ thuật ML, vì vậy hai cuốn sách khá hay (khá tiếc là tôi không thích cuốn sách bằng tiếng Ba Lan):
http://www.amazon.com/Machine-Learning-Alacticmic-Pers perspective-Rececition / dp / 1440067184
perspective-Rececition / dp / 1420067184 http: / /ai.stanford.edu/~nilsson/mlbook.html

Đối với nội dung số như tạo số ngẫu nhiên:
http://www.nr.com/


+1 cuốn sách Marsland khá hay và lấp đầy một khoảng trống lớn trong lựa chọn sách ML hiện có.
ars

1

Tôi nhặt được một bản sao Xác suất và Thống kê cho các nhà khoa học máy tính - Michael Baron bán cùng với một cuốn sách thống kê khác (Tôi thành thật mua nó vì cái tên - Tôi muốn một cuốn sách có thể nhìn vào số liệu thống kê từ góc độ khoa học máy tính, ngay cả khi nó không hoàn hảo). Tôi chưa có cơ hội đọc nó hoặc giải quyết bất kỳ vấn đề nào trong đó, nhưng có vẻ như đó là một cuốn sách vững chắc.

Lời nói đầu của cuốn sách nói rằng nó dành cho sinh viên đại học cấp trên và sinh viên mới bắt đầu, và tôi sẽ đồng ý với điều này. Một số hiểu biết về xác suất và thống kê là cần thiết để nắm bắt nội dung của cuốn sách này.

Các chủ đề bao gồm xác suất, các biến ngẫu nhiên rời rạc, phân phối liên tục, phương pháp Monte Carlo, quy trình ngẫu nhiên, hệ thống xếp hàng, suy luận thống kê và hồi quy.


1

Mặc dù nó không phải là thống kê tính toán cụ thể, Sổ tay phân tích thống kê sử dụng R - Brian S. Everitt và Torsten Hothorn bao gồm rất nhiều chủ đề mà tôi đã thấy trong các sách thống kê cơ bản và trung gian - suy luận, ANOVA, hồi quy tuyến tính, hồi quy logistic, ước tính mật độ, phân vùng đệ quy, phân tích thành phần chính và phân tích cụm - sử dụng ngôn ngữ R. Điều này có thể được quan tâm cho những người quan tâm đến lập trình.

Tuy nhiên, không giống như các cuốn sách khác, trọng tâm là sử dụng ngôn ngữ R để thực hiện các chức năng thống kê này. Các cuốn sách khác tôi đã thấy sử dụng kết hợp đại số và tính toán để chứng minh số liệu thống kê. Cuốn sách này thực sự tập trung vào cách phân tích dữ liệu bằng ngôn ngữ R. Và để làm cho nó hữu ích hơn nữa, các bộ dữ liệu mà các tác giả sử dụng nằm trong CRAN - Kho lưu trữ R.


1

Máy tính thống kê với R - Maria L. Rizzo bao gồm rất nhiều chủ đề về Xác suất và Thống kê cho các nhà khoa học máy tính - xác suất và thống kê cơ bản, biến ngẫu nhiên, thống kê Bayes, chuỗi Markov, trực quan hóa dữ liệu đa biến, phương pháp Monte Carlo, Kiểm tra hoán vị, xác suất ước tính mật độ, và phương pháp số.

Các phương trình và công thức được sử dụng được trình bày cả dưới dạng công thức toán học cũng như trong mã R. Tôi muốn nói rằng một kiến ​​thức cơ bản về xác suất, thống kê, tính toán và có thể là toán học rời rạc sẽ được khuyến khích cho bất cứ ai muốn đọc cuốn sách này. Một nền tảng lập trình cũng sẽ hữu ích, nhưng có một số tài liệu tham khảo cho ngôn ngữ R, toán tử và cú pháp.


1

Là một kỹ sư máy tính tự mình phân tích dữ liệu, một cuốn sách thực sự có thể đọc được bao gồm mọi thứ từ một quan điểm khá khó hiểu và dễ đọc (với chi phí không bao gồm nhiều như bất kỳ cuốn sách nào khác được đề xuất ở đây) là Lập trình trí tuệ tập thể của Toby Segaran. Tôi thấy nó dễ tiếp cận hơn nhiều, ví dụ, cuốn sách của Đức cha, một tài liệu tham khảo tuyệt vời nhưng đi sâu hơn mà bạn có thể muốn ở lần đầu tiên. Trên amazon: http://www.amazon.com/Programming-Collective-Intellect-BuILD-Appluggest/dp/0596529325


1

CRAN có một số ví dụ hay về các cuốn sách liên quan đến lập trình thống kê. Một số trong số chúng sẽ không liên quan đến học máy và MCMC, nhưng mỗi mục được chú thích, vì vậy bạn nên có một ý tưởng sơ bộ về những gì mỗi cuốn sách chứa để lặn thêm một chút. http://www.r-project.org/doc/bib/R-books.html

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.