(Rất) truyện ngắn
Câu chuyện dài, trong một số ý nghĩa, thống kê cũng giống như bất kỳ lĩnh vực kỹ thuật nào khác: Không có theo dõi nhanh .
Câu chuyện dài
Các chương trình cấp bằng cử nhân về thống kê tương đối hiếm ở Mỹ Một lý do tôi tin rằng điều này đúng là khá khó khăn để đóng gói tất cả những gì cần thiết để học tốt thống kê vào chương trình giảng dạy đại học. Điều này đặc biệt đúng ở các trường đại học có yêu cầu giáo dục phổ thông quan trọng.
Phát triển các kỹ năng cần thiết (toán học, tính toán và trực quan) tốn rất nhiều công sức và thời gian. Số liệu thống kê có thể bắt đầu được hiểu ở mức độ "hoạt động" khá tốt khi học sinh đã thành thạo tính toán và một số lượng khá lớn của đại số tuyến tính và ma trận. Tuy nhiên, bất kỳ nhà thống kê ứng dụng nào cũng biết rằng khá dễ dàng tìm thấy chính mình trong lãnh thổ không phù hợp với phương pháp thống kê cookie-cut hoặc dựa trên công thức để thống kê. Để thực sự hiểu những gì đang diễn ra bên dưới bề mặt đòi hỏi là điều kiện tiên quyếttoán học và, trong thế giới ngày nay, sự trưởng thành tính toán chỉ thực sự đạt được trong những năm sau đào tạo đại học. Đây là một lý do mà đào tạo thống kê thực sự chủ yếu bắt đầu ở cấp MS ở Mỹ (Ấn Độ, với ISI chuyên dụng của họ là một câu chuyện hơi khác. Một lập luận tương tự có thể được đưa ra cho một số nền giáo dục ở Canada. Tôi không đủ quen thuộc với Giáo dục thống kê đại học có trụ sở tại châu Âu hoặc Nga để có ý kiến chính xác.)
Gần như bất kỳ công việc (thú vị) nào cũng đòi hỏi một nền giáo dục cấp MS và các công việc thực sự thú vị (theo tôi) về cơ bản đòi hỏi một nền giáo dục cấp tiến sĩ.
Nhìn thấy khi bạn có bằng tiến sĩ toán học, mặc dù chúng ta không biết trong lĩnh vực nào, đây là những gợi ý của tôi về một cái gì đó gần gũi hơn với giáo dục cấp MS. Tôi bao gồm một số nhận xét về cha mẹ để giải thích các lựa chọn.
- D. Huff, Cách nói dối với Thống kê . (Rất nhanh chóng, dễ đọc. Hiển thị nhiều ý tưởng khái niệm và cạm bẫy, đặc biệt, trong việc trình bày số liệu thống kê cho giáo dân.)
- Tâm trạng, Graybill và Boes, Giới thiệu về Lý thuyết thống kê , tái bản lần 3, 1974. (Giới thiệu cấp độ MS về thống kê lý thuyết. Bạn sẽ tìm hiểu về phân phối mẫu, ước lượng điểm và kiểm tra giả thuyết trong khuôn khổ cổ điển, thường xuyên. ý kiến cho rằng điều này thường tốt hơn và tiên tiến hơn một chút so với các đối tác hiện đại như Casella & Berger hoặc Rice.)
- Seber & Lee, Phân tích hồi quy tuyến tính , tái bản lần 2. (Đưa ra lý thuyết đằng sau ước lượng điểm và kiểm tra giả thuyết cho các mô hình tuyến tính, đây có lẽ là chủ đề quan trọng nhất để hiểu trong thống kê ứng dụng. Vì bạn có thể có một nền tảng đại số tuyến tính tốt, ngay lập tức bạn có thể hiểu những gì đang diễn ra về mặt hình học , cung cấp rất nhiều trực giác. Cũng có thông tin tốt liên quan đến các vấn đề đánh giá trong lựa chọn mô hình, xuất phát từ các giả định, dự đoán và các phiên bản mạnh mẽ của mô hình tuyến tính.)
- Hastie, Tibshirani và Friedman, Các yếu tố của học thống kê , tái bản lần 2, 2009. (Cuốn sách này có cảm giác áp dụng hơn nhiều so với cuốn cuối cùng và bao quát rất nhiều chủ đề học máy hiện đại. Đóng góp chính ở đây là cung cấp các diễn giải thống kê. trong số nhiều ý tưởng học máy, đặc biệt là trong việc định lượng độ không đảm bảo trong các mô hình như vậy. Đây là điều có xu hướng không được đề cập trong các sách học máy thông thường. Có sẵn miễn phí tại đây .)
- A. Agresti, Phân tích dữ liệu phân loại , tái bản lần 2. (Trình bày tốt về cách xử lý dữ liệu rời rạc trong khung thống kê. Lý thuyết tốt và ví dụ thực tế tốt. Có lẽ về mặt truyền thống ở một số khía cạnh.)
- Boyd & Vandenberghe, Tối ưu hóa lồi . (Nhiều vấn đề ước lượng và ước lượng thống kê hiện đại phổ biến nhất có thể được coi là vấn đề tối ưu hóa lồi. Điều này cũng áp dụng cho nhiều kỹ thuật học máy, ví dụ, SVM. là khá có giá trị, tôi nghĩ. Hợp pháp có sẵn miễn phí ở đây .)
- Efron & Tibshirani, Giới thiệu về Bootstrap . (Ít nhất bạn nên làm quen với bootstrap và các kỹ thuật liên quan. Đối với sách giáo khoa, đây là cách đọc nhanh và dễ dàng.)
- J. Liu, Chiến lược Monte Carlo trong tính toán khoa học hoặc P. Glasserman, Phương pháp Monte Carlo trong kỹ thuật tài chính . (Cái sau nghe có vẻ rất hướng đến một lĩnh vực ứng dụng cụ thể, nhưng tôi nghĩ nó sẽ cung cấp một cái nhìn tổng quan và ví dụ thực tế về tất cả các kỹ thuật quan trọng nhất. Các ứng dụng kỹ thuật tài chính đã thúc đẩy một lượng lớn nghiên cứu của Monte Carlo trong thập kỷ qua hoặc hơn .)
- E. Tufte, Hiển thị trực quan của thông tin định lượng . (Trực quan hóa tốt và trình bày dữ liệu bị [đánh giá thấp], thậm chí bởi các nhà thống kê.)
- J. Tukey, Phân tích dữ liệu thăm dò . (Tiêu chuẩn. Oldie, nhưng goodie. Một số người có thể nói đã lỗi thời, nhưng vẫn đáng để xem qua.)
Bổ sung
Dưới đây là một số cuốn sách khác, chủ yếu có tính chất tiên tiến hơn, lý thuyết và / hoặc phụ trợ, rất hữu ích.
- FA Graybill, Lý thuyết và ứng dụng của mô hình tuyến tính . (Kiểu cũ, sắp chữ khủng khiếp, nhưng bao gồm tất cả cùng một nền tảng của Seber & Lee, và hơn thế nữa. Tôi nói lỗi thời vì các phương pháp điều trị hiện đại hơn có thể có xu hướng sử dụng SVD để thống nhất và đơn giản hóa rất nhiều kỹ thuật và bằng chứng.)
- FA Graybill, Ma trận với các ứng dụng trong Thống kê . (Văn bản đồng hành ở trên. Rất nhiều kết quả đại số ma trận tốt hữu ích để thống kê ở đây. Tham khảo bàn tuyệt vời.)
- Devroye, Gyorfi và Lugosi, Một lý thuyết xác suất của nhận dạng mẫu . (Văn bản nghiêm ngặt và lý thuyết về định lượng hiệu suất trong các vấn đề phân loại.)
- Brockwell & Davis, Chuỗi thời gian: Lý thuyết và phương pháp . (Phân tích chuỗi thời gian cổ điển. Xử lý lý thuyết. Đối với những ứng dụng được áp dụng nhiều hơn, các văn bản của Box, Jenkins & Reinsel hoặc Ruey Tsay đều đàng hoàng.)
- Motwani và Raghavan, Thuật toán ngẫu nhiên . (Phương pháp xác suất và phân tích cho các thuật toán tính toán.)
- D. Williams, Xác suất và Martingales và / hoặc R. Durrett, Xác suất: Lý thuyết và ví dụ . (Trong trường hợp bạn đã thấy lý thuyết đo lường, giả sử, ở cấp độ DL Cohn, nhưng có thể không phải là lý thuyết xác suất. Cả hai đều tốt để tăng tốc độ nhanh nếu bạn đã biết lý thuyết đo lường.)
- F. Harrell, Chiến lược mô hình hồi quy . (Không tốt như Các yếu tố của Học thống kê [ESL], nhưng có một điều khác biệt và thú vị, đảm nhận mọi thứ. Bao gồm nhiều chủ đề thống kê được áp dụng "truyền thống" hơn so với ESL và rất đáng để biết, chắc chắn.)
Các văn bản nâng cao hơn (cấp độ tiến sĩ)
Lehmann và Casella, Lý thuyết ước tính điểm . (Điều trị ở cấp độ tiến sĩ về ước tính điểm. Một phần của thử thách của cuốn sách này là đọc nó và tìm ra lỗi đánh máy là gì và không phải là gì. Khi bạn thấy mình nhận ra chúng nhanh chóng, bạn sẽ biết bạn hiểu. thuộc loại này trong đó, đặc biệt nếu bạn đi sâu vào các vấn đề.)
Lehmann và Romano, Thử nghiệm các giả thuyết thống kê . (Điều trị ở cấp độ tiến sĩ về kiểm tra giả thuyết. Không nhiều lỗi chính tả như TPE ở trên.)
A. van der Vaart, Thống kê tiệm cận . (Một cuốn sách hay về lý thuyết thống kê tiệm cận với những gợi ý hay về lĩnh vực ứng dụng. Mặc dù vậy, không phải là một cuốn sách ứng dụng. Điều khó hiểu duy nhất của tôi là một số ký hiệu khá kỳ quái được sử dụng và đôi khi chi tiết được chải dưới tấm thảm.)