Sách cho tổng quan rộng và khái niệm về phương pháp thống kê


12

Tôi rất quan tâm đến tiềm năng của phân tích thống kê để mô phỏng / dự báo / ước tính hàm, v.v.

Tuy nhiên, tôi không biết nhiều về nó và kiến ​​thức toán học của tôi vẫn còn khá hạn chế - tôi là sinh viên năm thứ hai chuyên ngành kỹ thuật phần mềm.

Tôi đang tìm một cuốn sách giúp tôi bắt đầu về một số thứ mà tôi tiếp tục đọc về: hồi quy tuyến tính và các loại hồi quy khác, phương pháp bayes, phương pháp monte carlo, học máy, v.v. Tôi cũng muốn bắt đầu với R vì vậy nếu có một cuốn sách kết hợp cả hai, điều đó thật tuyệt vời.

Tốt hơn là, tôi muốn cuốn sách giải thích mọi thứ một cách khái niệm và không có quá nhiều chi tiết kỹ thuật - tôi muốn số liệu thống kê rất trực quan với tôi, bởi vì tôi hiểu rằng có rất nhiều cạm bẫy rủi ro trong thống kê.

Tôi tất nhiên sẵn sàng đọc thêm sách để cải thiện sự hiểu biết của tôi về các chủ đề mà tôi cho là có giá trị.

Câu trả lời:


11
  • Có thể bạn muốn một cái gì đó như Phân tích dữ liệu và Đồ họa bằng R: Cách tiếp cận dựa trên ví dụ của John Maindonald và W. John Braun

    • Trang web cho cuốn sách
    • Amazon với các loại đánh giá
    • Tôi đề nghị nó bởi vì cuốn sách đánh dấu một vài hộp của bạn; nó dạy một chút R; nó cung cấp một cái nhìn tổng quan về một loạt các kỹ thuật mô hình khác nhau (ví dụ: hồi quy bội, chuỗi thời gian, đồ họa, mô hình tuyến tính tổng quát, v.v.) mà không đi sâu vào quá nhiều chi tiết toán học; nó được áp dụng khá nhiều.
  • Tôi đồng ý với @Greg Snow rằng bạn có thể nghĩ tốt hơn về việc đọc một số sách khác nhau. Đối với mỗi chủ đề bạn đã đề cập (ví dụ: thống kê Bayes, chuỗi thời gian, mô phỏng, R, học máy), có những cuốn sách hay dành riêng cho chủ đề cụ thể đó. Bạn có thể muốn đặt câu hỏi riêng về những gì sẽ là một cuốn sách tốt cho những sở thích cụ thể của bạn trong chủ đề đó.

  • Tốt tùy chọn có sẵn trực tuyến

    • Các yếu tố của học thống kê là một cuốn sách tuyệt vời và thậm chí có sẵn trực tuyến miễn phí. Từ bài đăng của bạn, tôi có cảm giác rằng nó có thể là một chút kỹ thuật hơn bạn muốn lúc đầu, nhưng hãy kiểm tra nó và xem những gì bạn nghĩ. Có lẽ bạn sẽ sẵn sàng cho nó bây giờ; có thể sau này
    • Các mô hình sinh thái và dữ liệu trong R của Bol Bolker là một mô hình tốt khác. Đó là từ góc độ sinh thái, nhưng giải thích mô phỏng và mô hình phù hợp rõ ràng từ góc độ tương đối phi kỹ thuật; và tất cả được triển khai trong R. Bạn có thể thấy tất cả mã R của anh ấy trên trang web. Bạn thậm chí có thể thấy các tài liệu Sweave được sử dụng để tạo ra cuốn sách!
    • Có một danh sách tốt các tài liệu R miễn phí về CRAN với một số tài liệu cũng cung cấp hướng dẫn rộng hơn về thống kê.

5

Một cuốn sách bao gồm tất cả các chủ đề đó sẽ khá ấn tượng và có lẽ nặng hơn bạn. Điều đó giống như yêu cầu một cuốn sách dạy lập trình cơ bản, C, Java, Perl và thiết kế cơ sở dữ liệu nâng cao tất cả trong một cuốn sách (thực sự có thể nhiều hơn, nhưng tôi không biết đủ các thuật ngữ tham gia phần mềm để thêm một số thuật ngữ nâng cao hơn vào) .

Hồi quy bản thân thường ít nhất là một khóa học đại học đầy đủ, thống kê Bayes yêu cầu một khóa học hoặc 2 lý thuyết trước khi tham gia khóa học Bayes để hiểu đầy đủ, v.v.

Không có con đường nhanh chóng và dễ dàng cho những gì bạn đang cố gắng làm. Tôi sẽ đề nghị tham gia một số khóa học tốt tại trường đại học của bạn và làm việc từ đó.

Đã có những cuộc thảo luận khác về những cuốn sách hay mà bạn có thể xem qua cho một số ý tưởng.


Cảm ơn về câu trả lời của bạn. Tuy nhiên, tôi không cố gắng hiểu mọi thứ về một cuốn sách, nhưng đọc nói, 50 trang về hồi quy chắc chắn sẽ giúp tôi rất nhiều để có được ít nhất một số hiểu biết hợp lý về chủ đề này ...
Jérôme Le Chatelier

5

Đối với sự kết hợp của R với nhiều phương pháp bạn mô tả, ngoài văn bản Maindonald và Braun được đề cập bởi @Jeromy Anglim, tôi khuyên bạn nên xem hai cuốn sách này của Julian Faraway:

Cả hai đều có phần giới thiệu hợp lý đơn giản cho các chủ đề khác nhau, phần sau bao gồm rất nhiều cách tiếp cận hiện đại hơn để hồi quy, bao gồm nhiều kỹ thuật học máy, nhưng với tốc độ nhanh hơn với ít mô tả hơn, và cả hai đều minh họa các kỹ thuật thông qua mã R.

Bạn có thể lấy mã từ Phần Sách của Trang web R để giảm 20% cho RRP nếu bạn mua trực tiếp từ Chapman & Hall / CRC Press, nhưng hãy kiểm tra giá Amazon hoặc tương tự cho khu vực của bạn vì mức giảm trên Amazon có cạnh tranh không với giá của nhà xuất bản sau khi giảm giá.

Một trong những điều tốt về cặp sách này là chúng mang đến cho bạn hương vị tốt của các phương pháp hiện đại với đủ chi tiết để sau đó khám phá các khu vực mà bạn muốn chi tiết hơn với các văn bản chuyên biệt hơn.

Một số nội dung đi vào những cuốn sách đó có sẵn trong bản PDF trực tuyến của Julian, thông qua phần Tài liệu đóng góp của Trang web R. Tôi khuyến khích bạn duyệt phần đó để xem liệu có tài liệu nào khác có thể giúp bạn bắt đầu mà không cần phải bỏ ra bất kỳ khoản tiền nào. Phiên bản đầu của văn bản biến thành phiên bản đầu tiên của văn bản Maindonald và Braun cũng có thể được tìm thấy trong phần này.


3

Vâng, nếu bạn muốn có một cái nhìn tổng quan của hầu hết các phương pháp thống kê, và mã R cho họ, bạn không thể đi quá xa với Venables và Thống Kê Ứng Dụng Modern Ripley tại S .

Nó gọn gàng, sáng suốt và có đủ mã R để giúp bạn bắt đầu với khá nhiều chủ đề thống kê mà bạn quan tâm để đặt tên.

Tôi đã mua cuốn sách này và cảnh giác về giá cả so với số trang, nhưng nó rất đáng để đầu tư. Họ giả định tính toán và đại số tuyến tính, nhưng cho rằng bạn là một kỹ sư, điều đó không nên là quá nhiều vấn đề.

Lập trình S của họ cũng rất tuyệt vời, nhưng có lẽ không phải là thứ bạn đang tìm kiếm ngay bây giờ.


2

Các yếu tố của học thống kê có thể hơi đáng sợ cho người mới bắt đầu. Tôi khuyên bạn nên đọc " Giới thiệu về học thống kê với các ứng dụng trong R ", có thể tải xuống miễn phí từ đây -> http://www-bcf.usc.edu/~gareth/ISL/ Nó cũng đã tìm ra các ví dụ trong R vào cuối mỗi chương.

" Học máy: Một viễn cảnh thuật toán " của Stephen Marsland cũng bao quát nhiều chủ đề rộng hơn mà không đi sâu vào toán học.


1

Các câu trả lời trước có rất nhiều về phía ứng dụng của sự vật. Theo như tài liệu khái niệm và tư duy thống kê tốt, tôi muốn đề xuất Lý thuyết Xác suất: Logic của khoa học của Edwin Jaynes. Ba chương đầu tiên có sẵn miễn phí tại đây

Mặc dù vậy, nó không có nhiều ưu điểm trong cách thức lập trình máy tính, vì vậy khía cạnh ứng dụng của vấn đề là cách điệu hơn. Có một chương tuyệt vời về những nghịch lý của lý thuyết xác suất, với một ngoại lệ, "nghịch lý bên lề", được giải quyết chính xác ở đây (mặc dù Jaynes về cơ bản "có được bài học" trong đó trước đó không phải là một giới hạn của một linh mục phù hợp) .


2
Bản thân tôi rất thích cuốn sách này, nhưng tôi không chắc nó là nơi để bắt đầu cố gắng xây dựng một trực giác để thống kê. Nó là một văn bản khá chính trị và bình dị.
Ben Lauderdale

1

Các đề xuất được đưa ra cho đến nay đều tuyệt vời nhưng được tập trung vào các kỹ thuật tiên tiến và tinh vi nhất bằng phần mềm R. Để có cái nhìn tổng quan tuyệt vời và trực quan về các kỹ thuật đa biến cổ điển, khung cơ bản cho các phương pháp cập nhật nhất, bao gồm hồi quy, ANOVA, phân tích nhân tố, phân tích cụm, phân tích phân biệt, phân tích bảng dự phòng và phân tích phương trình cấu trúc, Đa biến của Dillon và Goldstein Thống kê được công bố bởi Wiley trong những năm 80 vẫn là một tác phẩm kinh điển. Nó sáng suốt và được áp dụng trong các ví dụ của nó mà không quá lý thuyết hoặc được kết hợp với phần mềm.

Dillon và Goldstein là cuốn sách tôi muốn giới thiệu cho bất kỳ ai muốn hiểu về phương pháp học máy hiện đại bắt nguồn từ đâu.



0

R Cookbook là một cách tuyệt vời để nhảy vào R và bắt đầu học cách sử dụng nó. Nó rất thực tế, vì vậy thật tuyệt khi học sử dụng ngôn ngữ, nhưng bạn cũng nên tìm một cuốn sách lý thuyết hay.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.