Cuốn sách có ảnh hưởng nhất mà mỗi nhà thống kê nên đọc là gì?


77

Nếu bạn có thể quay ngược thời gian và bảo mình đọc một cuốn sách cụ thể khi bắt đầu sự nghiệp với tư cách là một nhà thống kê, thì đó sẽ là cuốn sách nào?


1
Thực sự có ba câu hỏi riêng biệt ở đây! 1) Cuốn sách có ảnh hưởng nhất trong thống kê là gì; 2) Cuốn sách nào mỗi nhà thống kê nên đọc; 3) Cuốn sách nào bạn đã đọc mà bạn mong muốn nhất là bạn đã đọc sớm hơn. (2) và (3) có thể có sự chồng chéo đáng kể; (1) có thể khá khác biệt.
onestop

1
Câu hỏi này là một cách khác để xem xét câu hỏi này. Tôi hy vọng rằng nó sẽ cung cấp một bổ sung tốt, một khi nó nhận được một số câu trả lời tốt.
ness101

Câu trả lời:


38

10
Cả hai đều có giá trị đọc lại định kỳ, có thể một lần một thập kỷ, chỉ để làm mới các ý tưởng. Liên quan đến Tukey: thật tuyệt khi chỉ ngồi xuống bằng bút chì và giấy một lần và phân tích sâu về một bộ dữ liệu thú vị.
whuber

6
Đối với đồ họa cho một nhà thống kê, tôi thích sách của William Cleveland hơn Tufte.
Peter Flom

1
Tôi có cảm giác những cuốn sách này được dùng để phân tích dữ liệu phi tuyến tính khi các phương pháp phi tuyến tính không có sẵn?
Robert Kubrick

34

Các yếu tố của việc học thống kê từ Hastie, Tibshirani và Friedman http://www-stat.stanford.edu/~tibs/ElemStatLearn/ nên có trong bất kỳ thư viện thống kê nào!


6
Tôi không đồng ý - rằng một trong những liên quan chặt chẽ đến học máy, không phải số liệu thống kê mỗi se !
aL3xa

@ aL3xa: nó chắc chắn tập trung vào học máy ... đó là lý do tại sao tôi nghĩ rằng các nhà thống kê nên được tiếp xúc với nó sớm.
Vách đá AB

Rõ ràng tôi là thiểu số trong suy nghĩ cuốn sách này được đánh giá cao. Nó dường như được viết cho một sinh viên tốt nghiệp, nhưng một người không quan tâm đến các chi tiết về cách mọi thứ hoạt động.
The Laconic

25

Tôi không phải là người thống kê, và tôi chưa đọc nhiều về chủ đề này, nhưng có lẽ

Trà nếm phụ nữ: Làm thế nào thống kê cách mạng khoa học trong thế kỷ XX

nên đề cập đến? Nó không có sách giáo khoa, nhưng vẫn đáng đọc.


1
Tôi thứ hai này. Ngoài ra, có khá nhiều gợi ý để đọc thêm mà tôi nghĩ là hữu ích trong cuốn sách.
Chris Beeley

1
Tôi nghĩ rằng cuốn sách này nói với những người không biết gì ngay từ đầu nhưng sự khó hiểu của ngôn ngữ và hành lý văn hóa liên quan đến lĩnh vực này. Cuốn sách này đã chắp cánh cho tâm trí - nó nói rằng số liệu thống kê là về việc tìm kiếm sự thật hữu ích trong một biển ồn ào và hiểu lầm.
EngrStudent

2
Nhiều người đã báo cáo điều này là giải trí, nhưng nó đầy lỗi phi thường. Nếu bạn có thể tìm thấy nó, đánh giá của tôi trong Sinh trắc học 57: 1273-1274 (2001) đưa ra một danh sách xa. (Salsburg bị nhiều Bernoullis trộn lẫn, điều này dễ thực hiện hơn.)
Nick Cox

21

Cuốn sách này là khó khăn. Đó là về nền tảng của xác suất và ngay cả trong phần Thống kê đó, tôi không nghĩ đó là một văn bản tham khảo. Tôi tin rằng có thể có 14 người trên hành tinh Trái đất đã đọc và hiểu toàn bộ thông điệp của nó, nhưng tôi có lẽ sẽ phân loại điều này là phải đọc cho các nhà xác suất, vì lợi ích của hàng ngàn người khác chuyên sâu về GLM, GAM, Mô hình Bayes và những thứ khác.
có nghĩa là

1
Cũng có một chút buồn khi một số chương sau bị thiếu và / hoặc chưa được phát triển - ví dụ như không có chương về hồi quy, nhưng một bản thảo chưa xuất bản đã có sẵn với một số hiểu biết hấp dẫn về hồi quy "lỗi đo lường". Một số thứ rất mát mẻ trên chuỗi thời gian mặc dù.
xác suất

21

5
Quay lại khi đây là $ 3,95 và sau đó là $ 4,95, tôi đã mua hàng chục bản sao và tặng chúng cho bạn bè, khách hàng và bất kỳ ai khác có thể quan tâm.
whuber

Nó đáng được ghi nhớ. Nhưng thật không may, nội dung không thống kê này lại không may, ít nhất là một phần lớn phim hoạt hình có người hút thuốc (và thậm chí cả trẻ sơ sinh) hút thuốc. Hơn 60 năm trôi qua, điều đó không còn thú vị nữa. (Một số tái bản, ví dụ như một ở Anh đã cập nhật phim hoạt hình.)
Nick Cox

14

Không phải là một cuốn sách, nhưng gần đây tôi đã phát hiện ra một bài viết của Jacob Cohen trong Nhà tâm lý học Mỹ có tựa đề "Những điều tôi đã học được (cho đến nay)." Nó có sẵn dưới dạng pdf ở đây .


Đó là một bài viết tuyệt vời, được viết theo phong cách trò chuyện và sáng suốt của Cohen.
richiemorrisroe

12

Từ lâu, chuyên khảo nhỏ "Giới thiệu về suy luận thống kê" của Jack Kiefer đã bóc tách bí ẩn của rất nhiều thống kê cổ điển và giúp tôi bắt đầu với phần còn lại của văn học. Tôi vẫn đề cập đến nó và nhiệt tình giới thiệu nó cho các sinh viên mạnh mẽ trong các khóa học thống kê năm thứ hai.


2
Lời khuyên tuyệt vời, cảm ơn bạn - Tôi đã nhận được một bản sao gần đây dựa trên điều này và nó thực sự khá tốt.
ars

1
Tôi rất vui khi nghe người khác đánh giá cao cuốn sách này!
whuber

12

Tôi sẽ không tranh luận rằng một trong hai trong số này nên được coi là "cuốn sách có ảnh hưởng nhất ... [cho] nhà thống kê [s]", nhưng đối với những người mới bắt đầu tìm hiểu về chủ đề này, hai cuốn sách hữu ích là:

  1. Robert Abelson, Thống kê như lý luận nguyên tắc
  2. Paul Murrell, Giới thiệu về Công nghệ dữ liệu

Abelson sẽ hữu ích cho nhiều người không chỉ bắt đầu, là tốt.
Peter Flom

11

Cuốn sách "Các yếu tố của dữ liệu đồ thị" của William Cleveland hoặc cuốn sách "Trực quan hóa dữ liệu" của ông


1
Tôi hiện đang đọc qua The Elements (Trực quan hóa dữ liệu không có trong thư viện trường hiện tại của tôi). Sự khác biệt giữa các yếu tố và dữ liệu trực quan là gì? Tôi đã không thể tìm thấy các mô tả đủ chi tiết để hình thành chính xác sự khác biệt giữa hai điều này.
Andy W

2
Tôi đồng ý. Tôi nghĩ rằng, đối với các nhà thống kê, Cleveland tốt hơn Tufte.
Peter Flom

3
+1 cho Robert Alberts, & +1 cho Peter Flom (sách của Cleveland chắc chắn tốt hơn cho các nhà thống kê, mặc dù Tufte cũng rất đẹp và tôi đã đọc tất cả chúng). @AndyW, Các yếu tố mang tính giới thiệu, ví dụ: nó có các hướng dẫn để tạo một đồ họa thông tin. Hình dung cho thấy cách tập trung vào quá trình khám phá dữ liệu của bạn xung quanh đồ họa; nó bắt đầu bằng việc trực quan hóa dữ liệu sơ bộ, nói về các vấn đề trong tay và tìm mọi cách để đánh giá mô hình cuối cùng (ví dụ, phân tích dư) thông qua đồ họa. Cái sau có nhiều thông tin hơn cái trước.
gung

@AndyW Một trong số đó là kỹ thuật hơn một chút (tôi quên đó là cái gì vậy!)
Peter Flom

1
Như @gung nói, Visualization là phần tiếp theo nâng cao hơn cho Element . Có một số chồng chéo nhưng nó hữu ích hơn là gây khó chịu. Cả hai đều khuyến khích mạnh mẽ. Ngày sửa đổi cuối cùng năm 1993 và 1994, nhưng chúng vẫn còn mới hơn 20 năm sau. Lưu ý rằng những người đọc không có kỹ thuật sẽ nhận được giá trị từ cả hai: Tôi có thể khẳng định cá nhân rằng toán học ở trường trung học là đủ nền tảng.
Nick Cox





6

Về mặt toán học / nền tảng: Phương pháp thống kê toán học của Harald Cramér .


Nhân tiện, đây là nơi sớm nhất tôi tìm thấy đề cập đến phi Cramer. Thật ngạc nhiên khi một sidenote nhỏ đáng yêu trong cuốn sách đó đã trở thành một phương pháp nổi tiếng trong nhiều thập kỷ sau đó.
Tal Galili

5

Để giải thích rõ ràng những gì nên có trong các bài báo của tạp chí khoa học xã hội (hỗ trợ nếu bạn đang viết hoặc đánh giá ngang hàng) Tôi thích Hướng dẫn của Người phản biện về Phương pháp định lượng trong Khoa học xã hội . Đặc biệt tôi thích bảng desideratra như một bản tóm tắt mức tối thiểu mà một bài báo (bài báo, luận văn, luận văn) nên có. Các chương được phân tách bằng kỹ thuật phân tích, đó là tốt đẹp. Tôi nghĩ rằng cuốn sách có các ứng dụng rộng hơn "chỉ" các ngành khoa học xã hội vì các kỹ thuật được đề cập được sử dụng trên nhiều lĩnh vực.

Khá sớm, vì vậy có lẽ không bao gồm câu hỏi, tôi được giới thiệu về Giới thiệu về Phương pháp thống kê và Phân tích dữ liệu của Ott . Nó khá tốn kém, nhưng là một nguồn tài nguyên tuyệt vời để hiển thị các mô hình thống kê cơ bản cho các phương pháp GLM khác nhau. Tôi mơ về ngày mà các tạp chí yêu cầu các bài báo có chứa công thức của mô hình thống kê được thử nghiệm.

Để kiểm tra các giả định kiểm tra, xem xét ảnh hưởng của các tùy chọn khác nhau trong một bài kiểm tra, v.v., đây là cuốn sách tôi ước mình có khi học . Tôi có phiên bản trước và đó là một trong những tài nguyên chung tốt nhất tôi đã mua vì cách thức rõ ràng và nhất quán trong đó thông tin về các bài kiểm tra được đưa ra. Nó chứa các ví dụ đẹp minh họa (các) bài kiểm tra và không yêu cầu người đọc phải có một gói thống kê cụ thể để tuân theo các giải trình.


4

Được đánh lừa bởi tính ngẫu nhiên của Taleb

Taleb là một giáo sư tại Columbia và là một nhà giao dịch quyền chọn. Ông đã kiếm được khoảng 800 triệu đô la trong năm 2008 cá cược với thị trường. Ông cũng viết Thiên nga đen. Ông thảo luận về sự vô lý của việc sử dụng phân phối bình thường cho các thị trường kiểu mẫu, và triết lý về khả năng sử dụng cảm ứng của chúng ta.


8
Một cuốn sách khủng khiếp, được viết bởi một người không hiểu số liệu thống kê ...
Xi'an

4
Xi'an, quan tâm để mở rộng, hoặc cung cấp liên kết đến một số phê bình?
ness101

4
Có một loạt các bình luận về The Black Swan (và nói chung là Taleb) ở đây
Peter Flom


4

Tôi đã đọc các khuyến nghị ở trên và rất ngạc nhiên khi thấy rằng hầu hết những người trả lời câu hỏi là những người không phải là thống kê. Với 2 hoặc 3 trường hợp ngoại lệ ... Là một nhà thống kê công nghiệp tình cờ làm việc với các nhà khoa học xã hội và chuyên gia y tế, tôi sẽ nói rằng nếu tôi chỉ có thể mang theo một cuốn sách đến một hòn đảo sa mạc thì đó sẽ là George EP Box, Statistics for Experimenters (Wiley). Trong phong cách hài hước và sáng suốt không thể bắt chước của mình, ông giải thích bản chất và triết lý xây dựng các mô hình toán học cho dữ liệu thực. Suy nghĩ nghiêm ngặt, không phù phiếm toán học, không vô nghĩa, dạy chúng ta suy nghĩ thống kê, cốt truyện và hình dung bất cứ điều gì bạn có thể. Một kiệt tác của một nhà khoa học ứng dụng có thẩm quyền (kỹ sư hóa học đã trở thành thống kê). Luôn luôn vui vẻ để đọc lại.


2
Sự lựa chọn tốt! Đồng tác giả của ông là William Hunter và J. Stuart Hunter quá cố cũng đóng góp cho cuốn sách.
Michael Chernick

Phiên bản đầu tiên sạch hơn và tươi hơn phiên bản thứ hai. Box là một nhà thống kê vĩ đại nhưng trong cuộc sống sau này là một người đọc bằng chứng nghèo nàn.
Nick Cox


3

Rất nhiều cuốn sách hay đã được đề xuất. Nhưng đây là một vấn đề khác: "Tính toán rủi ro" của Gerd Gigerenzer bởi vì hiểu cách thống kê ảnh hưởng đến các quyết định quan trọng hơn là làm cho tất cả các lý thuyết đúng. Trong thực tế tội lỗi số một của các nhà thống kê là không giao tiếp rõ ràng. Cuốn sách của ông nói về hậu quả của giao tiếp kém và làm thế nào để tránh nó.


"Hiểu cách thống kê ảnh hưởng đến các quyết định quan trọng hơn việc hiểu đúng lý thuyết ..." Đó có phải là sự thật không? Tôi đến từ một nền tảng kiến ​​trúc, và tôi có thể nói với bạn, đôi khi lý thuyết chỉ cản trở ...
naught101

2

Tôi sẽ đi trước và đề xuất một cuốn sách giáo khoa tiêu chuẩn trong lĩnh vực này. Tôi đang nói về Xác suất và Thống kê của Degroot và Schervish, xuất bản lần đầu năm 1975.

Cuốn sách này đã phục vụ như một cuốn sách giáo khoa cho nhiều học sinh và được coi là một tác phẩm kinh điển, đúng theo quan điểm của tôi. Nó bao gồm các chủ đề như tổ hợp, phân phối, thống kê bayes, khả năng suy luận và phân tích hồi quy. Theo như tôi biết thì không có sách giáo khoa nào khác kỹ lưỡng đến vậy nên tôi tin rằng nó là thứ bắt buộc phải có.



1

Hướng dẫn cần thiết về kích thước hiệu ứng: Sức mạnh thống kê, Phân tích tổng hợp và Giải thích kết quả nghiên cứu của Paul D. Ellis

Cuốn sách này nếu "phải có" cho tất cả mọi người thực hiện bất kỳ nghiên cứu khoa học nào, đặc biệt là cuốn sách không đến từ các số liệu thống kê / toán học thuần túy. Cuốn sách dưới đây mở rộng cuốn đầu tiên về khoảng tin cậy.

Hiểu các số liệu thống kê mới: Kích thước hiệu ứng, khoảng tin cậy và phân tích tổng hợp bằng Geoff Cumming


1

"Ảnh hưởng nhất" là một khái niệm rất khác với "mọi người nên đọc". Tôi không đủ điều kiện để trả lời câu hỏi thứ nhất - bạn cần một người là nhà sử học thống kê - nhưng lần thứ hai, đây là một số:

  1. Số liệu thống kê theo nguyên tắc của Robert Abelson nên được đọc bởi bất kỳ ai làm hoặc sử dụng số liệu thống kê trong việc theo đuổi khoa học, nhân văn, v.v.

  2. Hai cuốn sách về đồ họa của William S. Cleveland: Các yếu tố của dữ liệu đồ thịDữ liệu trực quan . Đối với các nhà thống kê, tôi đã đặt chúng trước các tác phẩm của Tufte, bot vì Tufte không đáng giá nhưng vì a) Cleveland đã viết với các nhà thống kê như khán giả dự định của mình và b) Cleveland dựa trên các khuyến nghị của ông về dữ liệu thử nghiệm về cách mọi người nhìn vào biểu đồ, hơn là trực giác.

  3. Phân tích dữ liệu thăm dò của John Tukey. Nó có niên đại nhưng có giá trị - bạn có thể làm được rất nhiều với bút chì và giấy và bộ não (ít nhất, nếu bộ não của bạn tốt như Tukey!)


1

Nó có thể là Phân tích dữ liệu Bayes của Gelman hoặc Deep Learning với Python . Nhưng đó là một chút giống như dùng streptomycin cho tuổi trung niên. Những điều này không được viết khi tôi bắt đầu sự nghiệp của mình và một vài điều từ những cuốn sách sẽ là tin tức lớn sau đó. Một số trong những điều có ảnh hưởng nhất mà mọi người nên biết là không có nguồn nào cả (có lẽ chúng nên, nhưng ...).


0

Hướng dẫn về Kinh tế lượng của Kennedy chứa rất nhiều lời khuyên thực tế về một loạt các phân tích thống kê. Đó là bằng cách nào đó cả hai thông tin cực kỳ dày đặc và dễ đọc, và tôi vẫn học được điều gì đó mới mỗi khi tôi nhặt nó lên.

Kinh tế lượng giới thiệu của Wooldridge cũng có một số lượng tốt của loại thảo luận này, nhưng như một cuốn sách giáo khoa giới thiệu, nó khép kín hơn. Tôi ước tôi có một khóa học dựa trên nó.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.