Đề xuất một số sách / bài viết / hướng dẫn để nhập phân tích dự đoán?


10

Tài liệu học tập nào bạn muốn đề xuất cho một người làm CS / nhà thống kê người mới / nhà toán học mới làm quen để phân tích dự đoán?



Tôi đã thu thập một số liên kết ở đây: meta.stats.stackexchange.com/questions/6/ trên
ars

1
Q này đã xuất hiện trở lại trên trang 'câu hỏi hoạt động' khi nó được 'chọc' bởi quy trình nền 'Cộng đồng', một trong những nhiệm vụ của nó là "Chọc ngẫu nhiên những câu hỏi chưa được trả lời mỗi giờ để họ được chú ý". Tôi không nghĩ câu hỏi này đáng được chú ý nữa. Đó là wiki cộng đồng, nó chỉ nhận được một phiếu bầu, đã có câu trả lời hợp lý vào ngày 26 tháng 8 nhưng người dùng đã hỏi nó được nhìn thấy lần cuối vào ngày 24 tháng 8, vì vậy có vẻ như người dùng sẽ không bao giờ chấp nhận câu trả lời. Tôi đề nghị nó nên được đóng bởi một người điều hành.
vào

Câu trả lời:


20

Không cần phải gọi nó là Phân tích dự đoán :) Nó đã có hai tên: thống kê và khai thác dữ liệu.

Sách thống kê cho người mới bắt đầu: Số liệu thống kê bằng tiếng Anh
thuần túy Sách thống kê nâng cao: Phân tích đa biến, theo
cuốn sách Khai thác dữ liệu tóc : Tôi vẫn chưa tìm thấy một cuốn sách hay, nhưng Khai thác dữ liệu của Witten vẫn ổn.

Đừng quá bối rối bởi tất cả các chi tiết. Nói chung chỉ có rất nhiều thứ bạn có thể hoàn thành:

  1. dự đoán một số thực (hồi quy)
  2. dự đoán một số nguyên (phân loại)
  3. mô hình hóa (giống như hai mô hình trên, nhưng con người có thể hiểu được mô hình)
  4. quan sát tương tự nhóm (phân cụm)
  5. nhóm yếu tố tương tự (phân tích nhân tố)
  6. mô tả một yếu tố duy nhất
  7. mô tả mối quan hệ giữa nhiều yếu tố (tương quan, liên kết, v.v.)
  8. xác định xem giá trị dân số có khác với giá trị khác hay không, dựa trên mẫu
  9. thí nghiệm thiết kế và tính toán cỡ mẫu

chúc may mắn!


Không có suy nghĩ cụ thể về cuốn sách của Tibshirani, Hastie, Các yếu tố của học thống kê? Tổng quan rất toàn diện về các phương pháp khác nhau. Tôi nghĩ rằng dù sao đó cũng sẽ là một cuốn sách khai thác dữ liệu tiên tiến tuyệt vời.
AdamO

"Sách thống kê cho người mới bắt đầu: Thống kê bằng tiếng Anh đơn giản" Có hai cuốn sách khác nhau có cùng tiêu đề của các tác giả khác nhau. Là người được nhắc đến ở đây bởi Harvey J. Brightman hay Timothy C. Urda?

Có phải đó cũng là Machine Learning không? Ngoài ra, xem câu hỏi này .
Dan Filimon

Dự đoán toàn bộ số không phải là phân loại mà là các mô hình như Poisson, NBD, v.v. Hãy cẩn thận với thuật ngữ của bạn khi nó quan trọng.
Ari B. Friedman

4

Truy cập http://www.vaultanalytics.com/books

Họ đã viết một cuốn sách về các mô hình dự đoán là gì, khi nào nên sử dụng các thử nghiệm / mô hình nào và cách tạo chúng trong Excel. Tôi đang sử dụng nó mỗi ngày trong công việc của tôi. Tôi nghĩ nó cực kỳ hữu ích.


4
Các lỗi nghiêm trọng trong Excel được mô tả tốt. Xem ví dụ biostat.mc.vanderbilt.edu/ExcelProbols . Thật khó để biết tại sao Excel sẽ được sử dụng khi có nhiều tài nguyên miễn phí tốt hơn xung quanh (ví dụ: R).
Frank Harrell

2

Đọc bài này ngay bây giờ: Phân tích dự đoán: Microsoft Excel

Bởi Carl Carlberg

Xuất bản ngày 2 tháng 7 năm 2012 bởi Quế.

  • ISBN-10: 0-7897-4941-6 ISBN-13: 980-0-7897-4941-3

Tôi chưa đọc xong, nhưng cho đến nay đây là một giới thiệu tốt về chủ đề cho một người không thống kê. Nó bắt đầu khá cơ bản với cả khái niệm stat và chức năng Excel và đang được xây dựng từ đó.

Trên mặt trận Thống kê, nó sẽ đi vào một cuộc thảo luận khá lành mạnh về việc sử dụng các đường trung bình và làm mịn để giúp xác định tín hiệu / nhiễu trong chuỗi thời gian.

Về mặt Excel, giải thích cách xây dựng các mô hình bằng các khái niệm trên (thay vì chỉ đưa ra một đường xu hướng Excel điển hình trên biểu đồ) và sử dụng một số chức năng bổ trợ Excels (ví dụ: Bộ giải và Phân tích dữ liệu).


0

Tôi đã viết một cuốn sách về chủ đề này:

"Phân tích dự đoán: Sức mạnh để dự đoán ai sẽ nhấp, mua, nói dối hoặc chết", bởi Eric Siegel, Ph.D. (Wiley, tháng 2 năm 2013)

Thông tin thêm: http://www.thepredictionbook.com

Thời báo tài chính đã chạy một đoạn trích dưới dạng một bài viết: http://www.thefiscaltimes.com/Articles/2013/01/21/The-Real-Story-Behind-Obamas-Election-Victory.aspx

Và có những trích đoạn khác có sẵn thông qua trang web cuốn sách ở trên.

Hãy cho tôi biết nếu bạn có bất kỳ câu hỏi về cuốn sách!


1
Eric, vì một số lý do, trang web của bạn được đánh giá rất kém với Web of Trust. Rõ ràng cho phần mềm độc hại? mywot.com/en/scorecard/ trộm
Dan Filimon

0

Có khá nhiều sách xung quanh. Trên đây là tất cả khá tốt. Tôi cũng đã thực hiện một cuốn sách tập trung cụ thể vào phân tích dự đoán trong bán lẻ và dịch vụ tài chính.

Finlay, Steven (2012). Chấm điểm tín dụng, mô hình đáp ứng và xếp hạng bảo hiểm. Hướng dẫn thực hành để dự báo hành vi của khách hàng. Basingstoke: Palgrave Macmillan. SỐ 0-230-34776-2.

Đây chắc chắn không phải là một cuốn sách toán học "Lõi cứng", nhưng nó giới thiệu cơ bản cho họ các phương pháp chính như hồi quy logistic, mạng lưới thần kinh, v.v. Đặc biệt nó tập trung vào toàn bộ quá trình phát triển mô hình. Bắt đầu với việc lập kế hoạch dự án và đi qua để thực hiện và giám sát các mô hình bài trực tiếp.


0

Hơn nữa với ghi chú trước đây của tôi - Tôi chỉ muốn cho mọi người biết rằng cuốn sách mới của tôi: Phân tích dự đoán, Khai thác dữ liệu và Dữ liệu lớn. Huyền thoại, quan niệm sai lầm và phương pháp hiện đã được đưa ra. Có sẵn tại amazon và tất cả các cửa hàng sách tốt:

http://www.amazon.co.uk/s/ref=nb_sb_noss_1?url=search-alias%3Dstripbooks&field-keywords=predictive+analytics

Eric - cuốn sách của bạn được khuyến khích đọc.


1
Vui lòng đăng ký và hợp nhất 2 tài khoản của bạn (xem tại đây ). Sau đó, bạn sẽ có thể chỉnh sửa bài viết trước của bạn, trong số những lợi thế khác.
gung - Tái lập Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.