Nếu bạn có thể quay ngược thời gian và bảo mình đọc một cuốn sách cụ thể khi bắt đầu sự nghiệp với tư cách là một nhà thống kê, thì đó sẽ là cuốn sách nào?
Nếu bạn có thể quay ngược thời gian và bảo mình đọc một cuốn sách cụ thể khi bắt đầu sự nghiệp với tư cách là một nhà thống kê, thì đó sẽ là cuốn sách nào?
Câu trả lời:
Đây là hai để đưa vào danh sách:
Tufte. Màn hình hiển thị thông tin định lượng
Tukey. Phân tích dữ liệu thăm dò
Các yếu tố của việc học thống kê từ Hastie, Tibshirani và Friedman http://www-stat.stanford.edu/~tibs/ElemStatLearn/ nên có trong bất kỳ thư viện thống kê nào!
Tôi không phải là người thống kê, và tôi chưa đọc nhiều về chủ đề này, nhưng có lẽ
Trà nếm phụ nữ: Làm thế nào thống kê cách mạng khoa học trong thế kỷ XX
nên đề cập đến? Nó không có sách giáo khoa, nhưng vẫn đáng đọc.
Không phải là một cuốn sách, nhưng gần đây tôi đã phát hiện ra một bài viết của Jacob Cohen trong Nhà tâm lý học Mỹ có tựa đề "Những điều tôi đã học được (cho đến nay)." Nó có sẵn dưới dạng pdf ở đây .
Từ lâu, chuyên khảo nhỏ "Giới thiệu về suy luận thống kê" của Jack Kiefer đã bóc tách bí ẩn của rất nhiều thống kê cổ điển và giúp tôi bắt đầu với phần còn lại của văn học. Tôi vẫn đề cập đến nó và nhiệt tình giới thiệu nó cho các sinh viên mạnh mẽ trong các khóa học thống kê năm thứ hai.
Tôi sẽ không tranh luận rằng một trong hai trong số này nên được coi là "cuốn sách có ảnh hưởng nhất ... [cho] nhà thống kê [s]", nhưng đối với những người mới bắt đầu tìm hiểu về chủ đề này, hai cuốn sách hữu ích là:
Cuốn sách "Các yếu tố của dữ liệu đồ thị" của William Cleveland hoặc cuốn sách "Trực quan hóa dữ liệu" của ông
Tôi nghĩ rằng mọi nhà thống kê nên đọc Lịch sử thống kê của Stigler : Đo lường sự không chắc chắn trước năm 1900
Nó được viết rất đẹp, kỹ lưỡng và nó không phải là quan điểm của nhà sử học mà là của nhà toán học, do đó nó không tránh được các chi tiết kỹ thuật.
Tôi nói rằng màn hình hiển thị thông tin định lượng của Tufte và Freakonomics cho một cái gì đó thú vị.
Khuyến nghị cuốn sách thú vị của Andrew Gelman ở đây:
Ngoài "Lịch sử thống kê" do Graham đề xuất, một cuốn sách khác của Stigler đáng đọc là
Thống kê trên bảng: Lịch sử các khái niệm và phương pháp thống kê
Về mặt toán học / nền tảng: Phương pháp thống kê toán học của Harald Cramér .
Để giải thích rõ ràng những gì nên có trong các bài báo của tạp chí khoa học xã hội (hỗ trợ nếu bạn đang viết hoặc đánh giá ngang hàng) Tôi thích Hướng dẫn của Người phản biện về Phương pháp định lượng trong Khoa học xã hội . Đặc biệt tôi thích bảng desideratra như một bản tóm tắt mức tối thiểu mà một bài báo (bài báo, luận văn, luận văn) nên có. Các chương được phân tách bằng kỹ thuật phân tích, đó là tốt đẹp. Tôi nghĩ rằng cuốn sách có các ứng dụng rộng hơn "chỉ" các ngành khoa học xã hội vì các kỹ thuật được đề cập được sử dụng trên nhiều lĩnh vực.
Khá sớm, vì vậy có lẽ không bao gồm câu hỏi, tôi được giới thiệu về Giới thiệu về Phương pháp thống kê và Phân tích dữ liệu của Ott . Nó khá tốn kém, nhưng là một nguồn tài nguyên tuyệt vời để hiển thị các mô hình thống kê cơ bản cho các phương pháp GLM khác nhau. Tôi mơ về ngày mà các tạp chí yêu cầu các bài báo có chứa công thức của mô hình thống kê được thử nghiệm.
Để kiểm tra các giả định kiểm tra, xem xét ảnh hưởng của các tùy chọn khác nhau trong một bài kiểm tra, v.v., đây là cuốn sách tôi ước mình có khi học . Tôi có phiên bản trước và đó là một trong những tài nguyên chung tốt nhất tôi đã mua vì cách thức rõ ràng và nhất quán trong đó thông tin về các bài kiểm tra được đưa ra. Nó chứa các ví dụ đẹp minh họa (các) bài kiểm tra và không yêu cầu người đọc phải có một gói thống kê cụ thể để tuân theo các giải trình.
Được đánh lừa bởi tính ngẫu nhiên của Taleb
Taleb là một giáo sư tại Columbia và là một nhà giao dịch quyền chọn. Ông đã kiếm được khoảng 800 triệu đô la trong năm 2008 cá cược với thị trường. Ông cũng viết Thiên nga đen. Ông thảo luận về sự vô lý của việc sử dụng phân phối bình thường cho các thị trường kiểu mẫu, và triết lý về khả năng sử dụng cảm ứng của chúng ta.
Trong trường hợp bạn quan tâm, tôi đã xem xét cả trên Amazon và tại http://www.integrativestatistic.com/favorites.htmlm
Tôi đã đọc các khuyến nghị ở trên và rất ngạc nhiên khi thấy rằng hầu hết những người trả lời câu hỏi là những người không phải là thống kê. Với 2 hoặc 3 trường hợp ngoại lệ ... Là một nhà thống kê công nghiệp tình cờ làm việc với các nhà khoa học xã hội và chuyên gia y tế, tôi sẽ nói rằng nếu tôi chỉ có thể mang theo một cuốn sách đến một hòn đảo sa mạc thì đó sẽ là George EP Box, Statistics for Experimenters (Wiley). Trong phong cách hài hước và sáng suốt không thể bắt chước của mình, ông giải thích bản chất và triết lý xây dựng các mô hình toán học cho dữ liệu thực. Suy nghĩ nghiêm ngặt, không phù phiếm toán học, không vô nghĩa, dạy chúng ta suy nghĩ thống kê, cốt truyện và hình dung bất cứ điều gì bạn có thể. Một kiệt tác của một nhà khoa học ứng dụng có thẩm quyền (kỹ sư hóa học đã trở thành thống kê). Luôn luôn vui vẻ để đọc lại.
Rất nhiều cuốn sách hay đã được đề xuất. Nhưng đây là một vấn đề khác: "Tính toán rủi ro" của Gerd Gigerenzer bởi vì hiểu cách thống kê ảnh hưởng đến các quyết định quan trọng hơn là làm cho tất cả các lý thuyết đúng. Trong thực tế tội lỗi số một của các nhà thống kê là không giao tiếp rõ ràng. Cuốn sách của ông nói về hậu quả của giao tiếp kém và làm thế nào để tránh nó.
Tôi sẽ đi trước và đề xuất một cuốn sách giáo khoa tiêu chuẩn trong lĩnh vực này. Tôi đang nói về Xác suất và Thống kê của Degroot và Schervish, xuất bản lần đầu năm 1975.
Cuốn sách này đã phục vụ như một cuốn sách giáo khoa cho nhiều học sinh và được coi là một tác phẩm kinh điển, đúng theo quan điểm của tôi. Nó bao gồm các chủ đề như tổ hợp, phân phối, thống kê bayes, khả năng suy luận và phân tích hồi quy. Theo như tôi biết thì không có sách giáo khoa nào khác kỹ lưỡng đến vậy nên tôi tin rằng nó là thứ bắt buộc phải có.
Tôi đã học được rất nhiều từ thống kê Kinh Thánh Bayes:
Hướng dẫn cần thiết về kích thước hiệu ứng: Sức mạnh thống kê, Phân tích tổng hợp và Giải thích kết quả nghiên cứu của Paul D. Ellis
Cuốn sách này nếu "phải có" cho tất cả mọi người thực hiện bất kỳ nghiên cứu khoa học nào, đặc biệt là cuốn sách không đến từ các số liệu thống kê / toán học thuần túy. Cuốn sách dưới đây mở rộng cuốn đầu tiên về khoảng tin cậy.
Hiểu các số liệu thống kê mới: Kích thước hiệu ứng, khoảng tin cậy và phân tích tổng hợp bằng Geoff Cumming
"Ảnh hưởng nhất" là một khái niệm rất khác với "mọi người nên đọc". Tôi không đủ điều kiện để trả lời câu hỏi thứ nhất - bạn cần một người là nhà sử học thống kê - nhưng lần thứ hai, đây là một số:
Số liệu thống kê theo nguyên tắc của Robert Abelson nên được đọc bởi bất kỳ ai làm hoặc sử dụng số liệu thống kê trong việc theo đuổi khoa học, nhân văn, v.v.
Hai cuốn sách về đồ họa của William S. Cleveland: Các yếu tố của dữ liệu đồ thị và Dữ liệu trực quan . Đối với các nhà thống kê, tôi đã đặt chúng trước các tác phẩm của Tufte, bot vì Tufte không đáng giá nhưng vì a) Cleveland đã viết với các nhà thống kê như khán giả dự định của mình và b) Cleveland dựa trên các khuyến nghị của ông về dữ liệu thử nghiệm về cách mọi người nhìn vào biểu đồ, hơn là trực giác.
Phân tích dữ liệu thăm dò của John Tukey. Nó có niên đại nhưng có giá trị - bạn có thể làm được rất nhiều với bút chì và giấy và bộ não (ít nhất, nếu bộ não của bạn tốt như Tukey!)
Nó có thể là Phân tích dữ liệu Bayes của Gelman hoặc Deep Learning với Python . Nhưng đó là một chút giống như dùng streptomycin cho tuổi trung niên. Những điều này không được viết khi tôi bắt đầu sự nghiệp của mình và một vài điều từ những cuốn sách sẽ là tin tức lớn sau đó. Một số trong những điều có ảnh hưởng nhất mà mọi người nên biết là không có nguồn nào cả (có lẽ chúng nên, nhưng ...).
Hướng dẫn về Kinh tế lượng của Kennedy chứa rất nhiều lời khuyên thực tế về một loạt các phân tích thống kê. Đó là bằng cách nào đó cả hai thông tin cực kỳ dày đặc và dễ đọc, và tôi vẫn học được điều gì đó mới mỗi khi tôi nhặt nó lên.
Kinh tế lượng giới thiệu của Wooldridge cũng có một số lượng tốt của loại thảo luận này, nhưng như một cuốn sách giáo khoa giới thiệu, nó khép kín hơn. Tôi ước tôi có một khóa học dựa trên nó.