Cuốn sách nào được khuyến nghị để bắt đầu học thống kê sử dụng R cùng một lúc?


50

Sách để học thống kê sử dụng R

Chính xác thì cuốn sách tôi đang tìm là gì.

Những gì tôi đang tìm kiếm là một cuốn sách dạy bạn thống kê trong khi sử dụng R để cung cấp cho bạn kinh nghiệm thực tiễn và do đó cuối cùng giúp bạn học R cùng nhau. Tôi đã thấy trên amazon nhiều cuốn sách cố gắng làm điều đó, nhưng không phải với R. Ví dụ là Minitab và SAS.

Sách R và tính toán thống kê có phải là một lựa chọn không? - Vẫn chưa trả lời .

Sách Rtính toán thống kê: Giới thiệu về phân tích dữ liệu bằng S-Plus có vẻ khả thi, nhưng ý kiến ​​độc giả ở đây sẽ hữu ích và đáng hoan nghênh.

Làm thế nào cuốn sách liên quan đến các khóa học thống kê?

Để chính xác hơn về những gì tôi đang tìm kiếm, hãy xem xét hai khóa học này về kết quả học tập về thống kê từ một khoa toán tại trường đại học Tôi hiện đang là sinh viên:

Thống kê trung gianXác suất & Thống kê trung bình , nghĩa là, tôi đang tìm trong một cuốn sách một khóa học thống kê bình thường sẽ chuyển sang cấp độ trung cấp, thay vì chỉ là bảng và giấy để bạn học và sử dụng R. Điều đó cũng có nghĩa là tôi đang tìm một cuốn sách giả định rằng tôi muốn học thống kê ngay từ đầu.

Cuốn sách này cũng dành cho các nhà nghiên cứu.

Tôi cũng là một nhà nghiên cứu kỹ sư phần mềm, nhưng tôi đoán tình hình hiện tại nơi bạn được tìm thấy với hàng núi dữ liệu và muốn tìm hiểu số liệu thống kê để viết mã để tự động hóa, điều này có thể áp dụng cho nhiều lĩnh vực khác.

Điều đó có nghĩa là tôi không quan tâm đến việc tìm hiểu từng chi tiết của từng thuộc tính cho từng đường cong, nhưng quan tâm nhiều hơn đến việc hiểu ý nghĩa của dữ liệu cho lĩnh vực nghiên cứu của tôi, mặc dù tôi sẽ không phiền nếu cuốn sách muốn đi sâu vào điều đó .

Như một động lực cuối cùng, tôi thấy mình đọc các bài báo khoa học trong các cộng đồng khác nhau tuyên bố kết quả dựa trên suy luận thống kê trong khi không có bằng chứng nào có thể đọc được nếu các giả định / ràng buộc thống kê có bị vi phạm hay không.

Cuốn sách AR không liên quan nhiều đến thống kê sẽ không đảm bảo tôi không theo dõi thực tiễn này, đó cũng là lý do tại sao tôi quyết định tìm một cuốn sách gần giống với khóa học thống kê sử dụng R thay vì chơi xung quanh với một cuốn sách tổng quan.

Các câu hỏi liên quan trong Xác thực chéo.

Câu trả lời và phản hồi cho câu hỏi này.

@Julie

Những cuốn sách được đề xuất là rất ít tôi đã đi qua nhưng là một ví dụ không may phù hợp với tôi:

Thống kê giới thiệu với R , Sử dụng R cho Thống kê giới thiệu , Thống kê: Giới thiệu sử dụng R là một vài trong số những cuốn sách mà tôi đã xem trên amazon nhưng là về tổng quan thống kê hoặc đưa ra các giả định đòi hỏi kiến ​​thức thống kê trước đó. Vấn đề với sách tổng quan chủ yếu là về việc không chú ý đến các giả định, các ràng buộc và cung cấp đủ lời giải thích để dẫn đến ý nghĩa của thông tin.

Nếu bạn tin rằng không có cuốn sách nào phù hợp với nhu cầu này hoặc nghĩ rằng cuốn sách R hoặc Máy tính thống kê: Giới thiệu về Phân tích dữ liệu bằng S-Plus sẽ phù hợp với điều này, tôi cũng sẽ đánh giá cao loại câu trả lời này.

@Christopher Aden

Giới thiệu Xác suất và Thống kê Sử dụng R dường như là gần nhất nhưng vẫn rộng rãi với những gì tôi đang tìm kiếm.

Điều tôi mong đợi là một cuốn sách như David S. Moore, Khái niệm cơ bản về thống kê vì:

  • Nó bao gồm tất cả các đối tượng thống kê.
  • Nó sử dụng hai công cụ, miniTab và công cụ khác để học thực hành về phương pháp vừa được giải thích.
  • Nó rất nhiều giả định nổi bật và các ràng buộc. Điều này rất quan trọng đối với một nhà nghiên cứu chưa tham gia khóa học thống kê chuyên sâu và muốn sử dụng số liệu thống kê. Những cuốn sách tổng quan khó có thể bao quát chúng, điều này gây nguy hiểm cho các nhà nghiên cứu.
    • Bạn có thể xem bảng nội dung cuốn sách ở đây . Lưu ý cách tập trung vào số liệu thống kê và việc sử dụng công cụ là để cải thiện sự hiểu biết và khiến học sinh biết cách sử dụng các công cụ để thực hiện thống kê sau khi học một cách dễ dàng hơn. Nó không phải là về công cụ, về thống kê!

Tôi muốn chính xác điều tương tự, nhưng sử dụng R.

@Gregory Demin

Nó sử dụng R làm ví dụ sư phạm, giả sử bạn muốn tìm hiểu số liệu thống kê và tốt nhất, đó là nguồn mở. Thật không may, không bao gồm ANOVA cũng như ANCOVA, hoặc các môn học nâng cao hơn.

@Peter Ellis

Gợi ý tốt cho một cuốn sách giáo khoa bao gồm những gì muốn trong câu hỏi này.

Sách trong ý kiến ​​người hỏi mà trả lời câu hỏi.

@Peter Ellis và @Gregory Demin.

Bộ sưu tập Sách R trên Amazon

Amazon thảo luận về sách R cho các sinh viên khác nhau có thể được tìm thấy ở đây .

Bài giảng video Thống kê giảng dạy sử dụng R

Google Tech Talks từ năm 2007 cũng thúc đẩy câu hỏi này và đề cập nhiều hơn về Khai thác dữ liệu thay vì thống kê nhưng sử dụng R cùng nhau tại đây .

Câu trả lời:


15

Tôi nghĩ một lý do rất khó để trả lời điều này là R rất mạnh mẽ và linh hoạt đến mức giới thiệu thực sự về lập trình R vượt xa những gì thường thấy trong phần giới thiệu về thống kê. Những cuốn sách dạy thống kê sử dụng MiniTab, JMP hoặc SPSS đang thực hiện những điều tương đối đơn giản với phần mềm hầu như không làm trầy xước bề mặt của R có khả năng xử lý dữ liệu, mô phỏng, chức năng tùy chỉnh, v.v.

Phải nói rằng, tôi nghĩ rằng Số liệu thống kê hiện đại của Wilcox về khoa học xã hội và hành vi: Giới thiệu thực tiễn (2012) là một cuốn sách mới tuyệt vời. Nó giả định không có kiến ​​thức thống kê và đưa bạn từ đầu đến một loạt các kỹ thuật mạnh mẽ hiện đại; và giả định không có nhiều kiến ​​thức R hơn khả năng mở nó và tải một tập dữ liệu. Nó bao gồm nhiều kỹ thuật cổ điển bao gồm cả ANOVA (được đề cập trong OP).

Tôi sẽ thấy cuốn sách này tương đương với những cuốn sách giới thiệu số liệu thống kê và gói số liệu thống kê như SPSS cùng một lúc. Tuy nhiên, nó sẽ không dạy bạn lập trình trong R - chỉ cách phân tích thống kê hiện đại với nó, nhấn mạnh vào các kỹ thuật mạnh mẽ giải quyết các vấn đề đã biết với phân tích cổ điển được bao quanh bởi hầu hết các phương pháp khác để giảng dạy thống kê.

Ba vấn đề với các phương pháp cổ điển mà cuốn sách này đặc biệt đề cập ngay từ đầu là lấy mẫu từ các bản phân phối có đuôi nặng; xiên; và không đồng nhất.

Wilcox sử dụng R vì "Về việc tận dụng các kỹ thuật thống kê hiện đại, R rõ ràng chiếm ưu thế. Khi phân tích dữ liệu, chắc chắn đây là sự phát triển phần mềm quan trọng nhất trong quý cuối của thế kỷ. Và nó hoàn toàn miễn phí. , không có ý kiến ​​cho rằng chúng bị bỏ hoàn toàn ... Do đó, các minh họa được cung cấp về cách áp dụng các phương pháp tiêu chuẩn với R. Điều đặc biệt quan trọng ở đây là, ngoài ra, các minh họa được cung cấp về cách áp dụng các phương pháp hiện đại sử dụng hơn 900 R chức năng viết cho cuốn sách này. "

Cuốn sách này tuyệt vời đến nỗi sau khi chúng tôi mua một bản sao cho công việc tôi đã mua bản sao của chính tôi ở nhà.

Các tiêu đề chương là:

  1. tóm tắt bằng số và đồ họa của dữ liệu;
  2. xác suất và các khái niệm liên quan;
  3. phân phối mẫu và khoảng tin cậy;
  4. kiểm định giả thuyết;
  5. hồi quy và tương quan;
  6. phương pháp bootstrap;
  7. so sánh hai nhóm độc lập;
  8. so sánh hai nhóm phụ thuộc;
  9. ANOVA một chiều;
  10. thiết kế hai chiều và ba chiều;
  11. so sánh nhiều hơn hai nhóm phụ thuộc;
  12. nhiều so sánh;
  13. một số phương pháp đa biến;
  14. hồi quy mạnh mẽ và các biện pháp của hiệp hội;
  15. phương pháp cơ bản để phân tích dữ liệu phân loại;

Chỉnh sửa thêm - đã xem ví dụ David Moore về những gì bạn đang tìm kiếm, tôi thực sự nghĩ rằng cuốn sách của Wilcox đáp ứng nhu cầu.


1
Cảm ơn bạn rất nhiều Tôi rất vui khi nhận được một tài liệu tham khảo khác cũng có sẵn như là một cuốn sách có thể in được. Tôi sẽ chỉnh sửa bài chính sau để đưa vào tài liệu tham khảo của bạn nếu không ai làm điều đó vào lúc này! Thực sự thực sự đánh giá cao. Chỉ cần xác nhận, bạn có nghĩa là nó dạy bạn vẽ sơ đồ lý thuyết được đề cập? Đó là nhiều hơn tốt cho tôi! Vui lòng xác nhận.
Oeufcoque Penteano

Tôi không chắc ý của bạn là gì khi "vẽ lý thuyết" - nhưng chắc chắn nó sử dụng rộng rãi các ô, và có mã R để thực hiện tất cả các lý thuyết mà nó đưa ra (cả suy luận thống kê và âm mưu). Wilcox cũng cung cấp gói chức năng hoặc tài liệu tham khảo của riêng mình cho người khác về các phương pháp mạnh mẽ tiên tiến được phát triển trong vài thập kỷ qua. Mỗi kỹ thuật đi kèm với các ví dụ bao gồm mã. Tôi đã chỉnh sửa câu trả lời để bao gồm các tiêu đề chương.
Peter Ellis

Vâng, bạn hoàn toàn hiểu đúng! Các đoạn mã giúp tôi thực hiện tất cả lý thuyết về R sẽ rất được hoan nghênh và cần thiết trong những gì tôi đang xem xét. Cảm ơn đã cung cấp danh sách! Tôi cũng cần một cuốn sách nói về bootstrap. Đã đặt hàng cuốn sách này. Sẽ chỉnh sửa bài chính sớm.
Oeufcoque Penteano

Tôi đã duyệt cuốn sách này. +500 về đề xuất này, CHÍNH XÁC những gì tôi đang tìm kiếm: Một bộ sưu tập đầy đủ thông tin về số liệu thống kê và chức năng phù hợp để sử dụng nó trên R (miễn phí và là nguồn mở yay!). Nó rất rẻ cho kích thước của cuốn sách này và tính độc đáo của nó. Đừng cảm thấy sợ hãi vì khoa học hành vi. Tôi đang sử dụng nó mặc dù tôi là một sinh viên CS. Tôi tìm thấy những cuốn sách thống kê hành vi thậm chí còn giúp ích cho tôi nhiều hơn những cuốn sách thống kê để hiểu những gì đang diễn ra. Tôi không nói một thống kê thuần túy là vô dụng, bạn cần một. Tôi đã sử dụng Paul Meyer (1965).
Oeufcoque Penteano

6

1
Gợi ý tuyệt vời, tôi sẽ coi đây là một câu trả lời hợp lệ nếu không có câu trả lời nào thêm về điều này, vì câu hỏi này vẫn không bao gồm các khái niệm nâng cao hơn như ANOVA (hoặc ít nhất là những gì tìm kiếm mà nó gợi ý). Tuyệt vời vì cũng miễn phí ..
Oeufcoque Penteano

4

@ Bài viết của Julie về cuốn sách của Verzani là một lựa chọn thực sự tốt cho những người không có R hoặc không có kinh nghiệm thống kê. Nó đủ mềm cho cả R và số liệu thống kê được sử dụng bởi khoa khoa học chính trị tại UC Davis và những sinh viên đó không có lớp lập trình hay toán cấp cao hơn. Công việc của anh ấy có sẵn thông qua gói CRAN của anh ấy, SimpleR .
Vì bạn đến từ nền tảng Khoa học Máy tính, tôi không nghĩ rằng bạn cần một lời giới thiệu rất nhẹ nhàng về R. Tôi cho rằng bạn có kiến ​​thức tốt về cấu trúc dữ liệu, phạm vi và lý do tại sao bạn cần một trình gỡ lỗi. Để có một viễn cảnh rất tập trung vào máy tính về R (moreso hơn bạn có thể thấy trong một lớp lập trình thống kê trong một bộ phận thống kê đại học), hãy xem The Art of R Lập trình của Norm Matloff. Để xem nếu nó làm bạn quan tâm, Matloff có một phiên bản in sẵn rất thô sơ có sẵn trên trang web của mình . Nếu bạn thích phong cách của anh ấy, tôi khuyên bạn nên lấy bản sao đã hoàn thành. Ông là một giáo sư CS, và ông viết cuốn sách này cho nhiều khán giả CS hơn là một khán giả thống kê.
G. Jay Kerns (một poster thường xuyên ở đây) cũng có một cuốn sách có sẵn trên mạng gọi là Giới thiệu về xác suất và thống kê Sử dụng R . Cá nhân tôi cảm thấy đó là một dịch vụ tuyệt vời để giới thiệu sự can đảm của R.
Tôi nhận ra câu hỏi của bạn được nhắm mục tiêu để có câu trả lời nhắm vào chuyên ngành CS, nhưng xin vui lòng xem lại chủ đề này: Bạn muốn giới thiệu cuốn sách nào cho các nhà khoa học không thống kê?


1
Tôi tin rằng Giới thiệu về Xác suất và Thống kê Sử dụng R là gần nhất nhưng vẫn không phải là thứ tôi đang tìm kiếm. Tôi đang chỉnh sửa câu hỏi trong một giây để tham khảo chính xác những gì tôi đang tìm kiếm, nhưng không may sử dụng miniTab thay vì R. Nghệ thuật lập trình R có vẻ quan tâm đến R hơn là thực tế học về thống kê (sửa tôi nếu tôi là sai), và một lần nữa cuốn sách trước liên quan đến tôi về việc đủ nghiêm ngặt về số liệu thống kê để đưa ra các giả định về nền tảng thống kê, điều mà tôi, không may thiếu. Tôi cũng sẽ tóm tắt những điểm chính.
Oeufcoque Penteano

Bạn đã đúng về TAoRP - nó chú trọng vào lập trình hơn là học thống kê. Tôi hơi bối rối trước câu hỏi của bạn. Trừ khi bạn muốn bắt đầu học thống kê toán học, bạn phải đưa ra một số giả định và đưa chúng vào đức tin - ít nhất là một thời gian ngắn. Bạn muốn một cuốn sách giới thiệu số liệu thống kê, các ví dụ trong R và không che đậy các giả định? Hầu hết các sách giới thiệu sẽ cung cấp một số trực giác đằng sau các giả định mô hình hóa, nhưng có thể không chính thức hóa logic. Bạn sẽ cần phải đọc một cuốn sách thống kê toán học cho điều đó, có lẽ.
Christopher Aden

Xin vui lòng xem cuốn sách tôi vừa đề cập về chỉnh sửa mới nhất của tôi về câu hỏi. Nó làm chính xác những gì tôi muốn. Trong thực tế, câu hỏi được đưa ra từ việc đọc những mẩu của cuốn sách này. Tôi muốn điều tương tự, nhưng với R. Tôi cũng nhấn mạnh vào những viên đạn những gì trong cuốn sách rất quan trọng trong phần động lực to lớn cho những người không bao giờ bắt gặp cuốn sách. Tôi hy vọng nó là rõ ràng bây giờ. Có thể xem mục lục của cuốn sách ở đây cũng như whfreeman.com/Catalog/product/iêu
Oeufcoque Penteano

3

Tôi thấy cuốn sách này rất hữu dụng, nhưng nó thừa nhận một số kiến ​​thức về các thuật ngữ thống kê cơ bản, chẳng hạn như p-value, ANOVA, et cetera.

Cuốn sách này cung cấp một giới thiệu nhẹ nhàng hơn nhiều cho chính các khái niệm thống kê ...


+1. Cuốn sách của Verzani là một giới thiệu rất nhẹ nhàng, và cũng có sẵn từ gói CRAN của anh ấy. Cuốn sách của Dalgaard cũng là một cuốn sách hay, và ông chắc chắn nói như một chuyên gia, không xa lạ gì trong thế giới R!
Christopher Aden

@ChristopherAden - cuốn sách nào bạn muốn giới thiệu để xây dựng một nền tảng vững chắc để suy nghĩ về thống kê về mặt khái niệm, mà không đi sâu (thực sự) vào chính toán học?
Julie

@Julie, chuyên ngành của bạn là gì? Một trong những ngày đó tôi nhận được một cuốn sách từ năm 1979 về số liệu thống kê cho sinh viên xã hội học từ một giáo sư xã hội. Đôi khi chúng hữu ích hơn, mặc dù một giáo sư đã đề cập trên amazon rằng họ có xu hướng mắc nhiều lỗi hơn đặc biệt là các công thức gây nguy hiểm cho các giáo sư không có quá nhiều trong thống kê :(
Oeufcoque Penteano

Julie: Đó chắc chắn là một câu hỏi tôi sẽ xem xét để đưa ra khuyến nghị tốt hơn. Tôi đã học được từ Thống kê: Nghệ thuật và Khoa học về Học tập từ Dữ liệu, bởi Agresti và Franklin. Tôi thấy cách tiếp cận dựa trên ứng dụng là tuyệt vời. Nó không cung cấp sự phân chia số liệu thống kê 50-50 mà OP muốn, vì vậy tôi không bận tâm đến việc đề cập đến nó. Mặc dù vậy, tôi vẫn là một tân binh để thống kê, vì vậy hãy sử dụng recs của tôi với một hạt muối.
Christopher Aden

1
Xin chào. Sẽ thật tuyệt nếu bạn có thể cung cấp một trích dẫn đầy đủ cho mỗi cuốn sách trong câu trả lời của bạn. :)
Đức hồng y

1

Một cuốn sách hay được sản xuất thông qua Đại học Adelaide, nó có sẵn trực tuyến miễn phí và mua cho bản cứng.

Học thống kê với R

Nó được chia nhỏ rất tốt trong cấu trúc của nó và bao gồm phần giới thiệu về R cũng như giới thiệu cơ bản về Thống kê trước khi chuyển sang các chủ đề chuyên sâu hơn.

Có một danh sách rất sâu các sách trên trang web R cung cấp nó như một tài liệu tham khảo tuy nhiên hiện tại vẫn chưa đọc tên sách, sẽ cập nhật khi tôi tiến về phía trước.

https://www.r-project.org/doc/bib/R-books.html


0

Học thống kê sử dụng R của Randall E. Schumacker sẽ ra mắt vào tháng 1 năm 2014 từ SAGE Publications. Nó chứa tất cả các tài liệu trong bài viết.


3
Mọi người nên cho chúng tôi biết về công việc của họ. Chúng tôi đánh giá cao việc có loại kiến ​​thức đầu tay đó. Tuy nhiên, đó không chỉ là một ý tưởng tốt để thừa nhận kết nối của một người với bất kỳ đề xuất nào: nó còn mang lại cho khuyến nghị nhiều sự tin cậy hơn và cung cấp cho bạn khoản tín dụng mà bạn xứng đáng nhận được :-). Có lẽ bạn có thể nhân cơ hội này, Randy, để khuếch đại câu trả lời của bạn, thừa nhận quyền tác giả của bạn và nói thêm về lý do tại sao cuốn sách của bạn sẽ là một lựa chọn tuyệt vời cho các mục đích được nêu trong câu hỏi. Và chào mừng đến với trang web của chúng tôi!
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.