Có cuốn sách khoa học phổ biến nào hay về thống kê hay học máy không?


39

Có một loạt các cuốn sách khoa học phổ biến thực sự tốt xung quanh, liên quan đến khoa học thực sự, cũng như lịch sử và lý do đằng sau các lý thuyết hiện tại, trong khi vẫn cực kỳ thú vị để đọc. Ví dụ: "Hỗn loạn" của James Gleick (hỗn loạn, gãy xương, phi tuyến tính), "Lịch sử ngắn về thời gian" của Stephen Hawking (vật lý, nguồn gốc của vũ trụ, thời gian, hố đen) hoặc "Gene ích kỷ" của Richard Dawkins (tiến hóa và chọn lọc tự nhiên). Một số trong những cuốn sách này trình bày lập luận (Dawkins) và một số không (Gleick). Nhưng tất cả đều phục vụ để làm cho những người trong chúng ta dễ dàng mà không có giáo dục khoa học chuyên sâu để hiểu các khái niệm khó khăn khác.

Có những cuốn sách như vậy tập trung chủ yếu vào Thống kê, hoặc học máy không?

Vui lòng bao gồm một bản tóm tắt về những gì mỗi cuốn sách bao gồm.


Tôi đã rất táo bạo khi thêm ML vào tiêu đề, vì cả số liệu thống kê và ML là hai chủ đề cấp cao nhất của trang web này và nếu không, người ta có thể cảm thấy bị cám dỗ khi đặt câu hỏi tương tự cho ML. Tôi hy vọng điều này là ok.
steffen

2
(+1) trong khi đọc cuốn sách như vậy về các chủ đề mà tôi biết đôi khi ... gây khó chịu, rõ ràng nó giúp có được một cái nhìn bên ngoài và hy vọng các ý tưởng để giải thích các khái niệm khó khăn cho giáo dân.
steffen

@steffen: vâng, tôi đã tự hỏi liệu tôi có nên bao gồm điều đó không. Thành thật mà nói tôi không quan tâm đến ML vào lúc này, nhưng tôi cho rằng các câu trả lời sẽ bao gồm các cuốn sách liên quan đến ML, vì từ góc độ khoa học đại chúng, ML và các số liệu thống kê về cơ bản là giống nhau. Dù sao, rất vui khi bao gồm nó, vì nó có thể có thêm một vài cuốn sách và việc sao chép là không cần thiết :)
naught101

@ naught101 Làm thế nào để biến đây thành một Wiki cộng đồng?
Momo

@Momo: rất vui vì điều đó đã xảy ra. Tôi không thể tự làm điều đó.
ness101

Câu trả lời:


18

Tôi nghi ngờ The Lady Nếm Trà , của David Salsberg chính xác là những gì bạn muốn. Nó được viết rất nhiều theo phong cách kể chuyện, gần giống như một cuốn tiểu thuyết, về cơ bản không có toán học (như tôi nhớ lại), vì vậy mọi người đều có thể truy cập được. Tôi đọc nó từ lâu và thực sự thích nó. Nó đọc rất nhanh, và có thể cho mọi người cảm nhận về phân tích thống kê là gì và làm thế nào nó có thể giúp chúng ta hiểu thế giới và giải quyết các vấn đề thực tế.


Vâng, tường thuật là thực sự quan trọng. Tôi sẽ đưa nó vào câu hỏi, nhưng một số ví dụ tôi đã sử dụng không có một câu chuyện tuyệt vời (ví dụ Dawkins), và tôi đã quên.
ness101

3
Vừa đọc xong, và đó chính xác là những gì tôi đang tìm kiếm, vì vậy cảm ơn bạn đã giới thiệu. Tôi thấy chất lượng viết khá kém, lúc đầu khá mất tập trung, nhưng tôi đã quen với nó sau một thời gian. Tài liệu được trình bày là tuyệt vời, và nó cung cấp một tài khoản lịch sử tuyệt vời về việc các số liệu thống kê đến từ đâu, và điều gì đã thúc đẩy mọi người khám phá, và cho bạn một cái nhìn thoáng qua về những gì sắp xảy ra, và cảm giác về khả năng thú vị của việc có được tham gia nhiều hơn vào lĩnh vực này. Có thể xem liệu tôi có thể khiến một số người bạn ghét thống kê của mình đọc nó không :)
naught 101

12

Cuốn sách mới của Nate Silver Tín hiệu và tiếng ồn: Tại sao hầu hết các dự đoán thất bại - Nhưng một số Đừng phù hợp với mô tả của bạn khá tốt. Nó cũng là một giới thiệu về tư duy Bayes cho giáo dân. Nó đã nhận được một số sự chú ý gần đây và một đánh giá của cuốn sách có thể được tìm thấy ở đây .

Cũng đáng kiểm tra là sách Freakonomics của Levitt & Dubner .


8

Đọc tốt hơn:

Lỗ hổng trung bình của Sam L. Savage

Được đánh lừa bởi tính ngẫu nhiên của Nassim Taleb

Cả hai đều là những cuốn sách cảnh báo về việc cẩn thận đối với cách diễn giải xác suất và thống kê trong cuộc sống hàng ngày của chúng ta. Ví dụ, trong thị trường tài chính, người ta có thể sử dụng sai phân phối gaussian hàng ngày như một biện pháp rủi ro với hậu quả tai hại, và do đó chúng ta có thể muốn sử dụng các mô hình dựa trên kinh nghiệm hơn (như mô phỏng monte carlo) trong thực tế. Taleb rất phổ biến trong giới tài chính và thường cảnh báo chúng tôi phải cẩn thận hơn về những thành kiến ​​hành vi và quá phụ thuộc vào người mẫu


8

"Lý thuyết sẽ không chết" của Sharon Bertsch McGrayne là một cuốn sách rất dễ đọc về lịch sử thống kê Bayes và ý tưởng chung đằng sau nó mà không bị sa lầy vào toán học.

Tôi cũng là một fan hâm mộ của "Hướng dẫn về thống kê phim hoạt hình" của Gonnick và Smith như một lời giới thiệu hay về khái niệm thống kê chung với một số phép toán, nhưng được trình bày theo cách không khiến bạn buồn ngủ (tôi cũng có hướng dẫn phim hoạt hình về di truyền, vật lý và hóa học và đã đọc một vài trong số những người khác).


6

Tôi muốn đề xuất những cuốn sách sau, mặc dù không phải là lý tưởng, bạn nên xem qua:

  1. Hành vi (Mis) của thị trường bởi (vĩ đại) B. Mandelbrot
  2. Bị mắc kẹt bởi ánh sáng của Jefferey Rosenthal

với phần trước tập trung hơn vào tài chính, nhưng vẫn thống kê, và phần sau là phần giới thiệu về tất cả các chủ đề xác suất thú vị: tỷ lệ cược, vấn đề Monty Hall, chức năng tiện ích, đi bộ ngẫu nhiên, v.v.


5

Một cuốn sách rất hay để trợ giúp kiến ​​thức thống kê cơ bản và lý luận thống kê - và để làm cho trường hợp này trở nên quan trọng - là The Tiger That Is not của Andrew Dilnot, người dẫn chương trình phát thanh nổi tiếng về thống kê ứng dụng cho BBC.

Tôi thường giới thiệu nó như là số liệu thống kê tương đương với cuốn sách khoa học pop nổi tiếng Bad Science của Ben Goldacre. Thật tốt khi giới thiệu lý luận thống kê cơ bản, vì đã cho thấy tầm quan trọng của lý luận thống kê cơ bản và khiến mọi người lo ngại về việc thiếu lý luận thống kê cơ bản giữa những người thực sự nên biết rõ hơn (đặc biệt là các chính trị gia, nhà báo, v.v.). Rất dễ tiếp cận, hấp dẫn, hài hước ở những nơi, lo lắng sâu sắc ở những người khác! Đặc biệt tốt khi giới thiệu cho bất cứ ai nghĩ về những con số là "không phải việc của họ".


4

Ian Ayres là tác giả của cuốn sách "Super Crunchers: Why Thinking-by-Numbers là cách mới để trở nên thông minh", thảo luận về một số ví dụ về khai thác dữ liệu.


3

Tôi hình dung tôi sẽ lấp đầy một khoảng trống ở đây bằng cách chỉ ra một vài cuốn sách hay về phong cách thị trường đại chúng trên các tập mờ, lý thuyết thông tin, entropy và lý luận thống kê mà tôi đã đọc và rất khuyến khích.

• Đối với tất cả mọi thứ mờ, một điểm khởi đầu không chính thức là McNeill, Dan, 1993, Fuzzy Logic. Simon & Schuster: New York.

• Để có một thị trường đại chúng giới thiệu tốt về mạng lưới thần kinh, được tổ chức xung quanh một số suy đoán thú vị về tổ chức của bộ não con người, xem Hawkins, Jeff, 2004, On Intelligence. Sách Thời báo: New York.

Để dễ dàng đọc phần giới thiệu về các chủ đề quan trọng như cạm bẫy của thống kê và lý luận sai lầm, hãy thử ba điều sau:

• Huff, Darrell, 1954, Cách nói dối với thống kê. WW Norton & Công ty New York.

• Kault, David, 2003, Thống kê với lẽ thường. Greenwood Press: Westport, Connecticut.

• Smith, Gary, 2014, Độ lệch chuẩn: Giả định sai sót, dữ liệu bị tra tấn và các cách khác để nói dối với thống kê. Nhìn ra báo chí: New York.

Sau đây là tất cả liên quan đến lý thuyết thông tin và entropy:

• Lucky, RW, 1989, Silicon Dreams: Thông tin, Con người và Máy móc. Nhà xuất bản St. Martin: New York.

• Tác giả này đã làm rất tốt khi đưa lý thuyết thông tin vào ngữ cảnh và chỉ ra sự lạm dụng của nó, trong khi vẫn viết theo cách mà một người không chuyên có thể nắm bắt: Pierce, John Robinson, 1961, Biểu tượng, Tín hiệu và Tiếng ồn: Bản chất và Quy trình truyền thông. Harper: New York.

• Tôi đã đọc tiêu đề tương tự này, nhưng không thể nhớ đó là phiên bản mới hơn hay tiếp theo: Pierce, John Robinson, 1980, Giới thiệu về Lý thuyết thông tin: Biểu tượng, Tín hiệu & Tiếng ồn. Ấn phẩm Dover: New York.

• Nếu tôi nhớ đúng, tác giả này có thể dễ đọc, trong khi vẫn đi vào một số khái niệm nâng cao hơn: Brillouin, Léon, 1964, Khoa học, Không chắc chắn và Thông tin. Báo chí học thuật: New York.

• Cũng xem Brillouin, Léon, 1962, Lý thuyết khoa học và thông tin. Báo chí học thuật: New York.

• Tôi đã đọc nó từ lâu, nhưng tin rằng tác giả này có thể đọc được và có một số quan sát thú vị về lý thuyết thông tin: Bar-Hillel, Yehoshua, 1964, Ngôn ngữ và thông tin: Các tiểu luận chọn lọc về lý thuyết và ứng dụng của họ. Quán rượu Addison-Wesley. Công ty đọc sách, thánh lễ.

Tôi muốn cảnh báo rằng các cuốn sách thị trường đại chúng về các chủ đề gây sốc như hỗn loạn, thông tin, vật lý lượng tử, xác suất, ngẫu nhiên, "Điều khiển học", tự tổ chức, các bộ mờ và trí tuệ nhân tạo chứa một thiểu số nhỏ nhưng nổi bật của vật chất được thổi cách ra khỏi tỷ lệ, đôi khi đến mức không hợp lệ về mặt logic. Mỗi lý thuyết này đều có những người đề xướng nổi tiếng, những người không biết khi nào nên dừng lại với một điều tốt và thực hiện những bước nhảy vọt logic để biến các lĩnh vực cụ thể của họ thành những giải thích hoành tráng về mọi thứ. Mỗi tác giả đều vượt xa các bằng chứng, thậm chí đến mức bỏ qua những cảnh báo rõ ràng của những người sáng lập lĩnh vực của họ, như Shannon đã làm về việc lạm dụng entropy thông tin. Có một cơn sốt, không lành mạnh trong văn bản của họ, mà đôi khi đủ điều kiện là khoa học rác được tạo ra bởi cranks. Tôi có thể kể tên một số tên nổi tiếng, những người tiếp tục in những điều kỳ quặc về những chủ đề này, dựa trên những ngụy biện logic rõ ràng và đôi khi rất sai lầm về những điểm thực tế. Tôi sẽ không làm điều đó ở đây để tránh một cuộc chiến nảy lửa nghiêm trọng, vì tôi phải gọi ra một số thần tượng và những con bò thiêng liêng. Chỉ cần lưu ý rằng tài liệu gây hiểu lầm thuộc loại này ở ngoài đó và sẵn sàng đánh dấu nó. Xem ra cho các yêu cầu đặc biệt mà không có bằng chứng phi thường cần thiết.


2

The Drunkard's Walk by Leonard Mlodinow là một phần giới thiệu dễ đọc về các chỉ số và xác suất cơ bản. Nội dung hướng đến đối tượng không có đào tạo thống kê hoặc toán học, và không có phương trình. Tôi thấy nó hơi quá đần độn. Có rất nhiều giai thoại liên quan đến các ứng dụng khác nhau của thống kê xấu và giải thích rõ ràng về lý do tại sao chúng sai.

Cuốn sách bao gồm các số liệu thống kê cơ bản và xác suất có điều kiện.


1

Những con số thống trị thế giới của bạn , bởi Kaiser Fung, mô tả tầm quan trọng của thống kê trong rất nhiều hệ thống cơ bản cho xã hội hiện đại, như thị trường bảo hiểm.

Number Sense , cũng bởi Kaiser Fung, nói về "dữ liệu lớn" cụ thể hơn.


0

Thuật toán tổng thể: Làm thế nào cuộc tìm kiếm cỗ máy học tập tối thượng sẽ làm lại thế giới của chúng ta là một cuốn sách của Pedro Sebastos phát hành năm 2015. Sebastos đã viết cuốn sách này để tạo ra sự quan tâm từ những người bên ngoài lĩnh vực.

Cuốn sách phác thảo năm bộ lạc của học máy: lý luận quy nạp, kết nối, tính toán tiến hóa, định lý Bayes và mô hình tương tự. Tác giả giải thích những bộ lạc này cho người đọc bằng cách tham khảo các quá trình logic dễ hiểu hơn, các kết nối được tạo ra trong não, chọn lọc tự nhiên, xác suất và phán đoán tương tự. Xuyên suốt cuốn sách, có ý kiến ​​cho rằng mỗi bộ lạc khác nhau có tiềm năng đóng góp cho một "thuật toán tổng thể" thống nhất.

https://en.m.wikipedia.org/wiki/The_Master_Alacticm

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.