Một quá trình phân tích dữ liệu thực tế tốt là gì?


15

Tôi muốn biết, hoặc có tài liệu tham khảo về quá trình phân tích hầu hết các nhà phân tích dữ liệu thống kê đi qua cho mỗi dự án phân tích dữ liệu.

Nếu tôi lập một "danh sách", để hoàn thành dự án phân tích dữ liệu, một nhà phân tích phải:

  1. thu thập yêu cầu đầu tiên cho dự án,
  2. lập kế hoạch / thiết kế phân tích dữ liệu của mình dựa trên những yêu cầu đó trước
  3. thực sự xử lý trước dữ liệu
  4. thực hiện phân tích dữ liệu và
  5. viết một báo cáo dựa trên kết quả phân tích của mình.

Đối với câu hỏi này, tôi quan tâm đến nhiều chi tiết hơn của Bước 2. Nhưng tôi hiểu điều này không thực sự rõ ràng vì nhà phân tích có thể phải thay đổi kế hoạch hoặc thiết kế của mình theo đầu ra phân tích dữ liệu. Có bất kỳ tài liệu tham khảo về chủ đề này?

Câu trả lời:


17

"Kế hoạch" hoặc "danh sách" yêu thích của tôi là tài liệu của Scott Emerson Sắp xếp phương pháp tiếp cận phân tích dữ liệu của bạn .

Lưu ý: hai trang cuối nằm dưới tiêu đề "Yêu cầu chung đối với bài kiểm tra tiến sĩ" nhưng lời khuyên đưa ra có khái quát để làm việc với bất kỳ vấn đề phân tích nào.


Yêu mọi phần của tài liệu. Cảm ơn các tài liệu tham khảo có giá trị.
Tae-Sung Shin

5

Tôi thấy Quy trình phân tích dữ liệu bằng Stata là một cuốn sách hay, đặc biệt (nhưng không chỉ) với tư cách là người dùng Stata. Tôi đã tìm thấy nhiều điều không đồng ý, nhưng thậm chí điều đó đã giúp làm rõ lý do tại sao tôi làm những việc nhất định.


4
+1 nhưng, hãy cẩn thận : cuốn sách này chỉ có giá trị nếu bạn là người dùng Stata. Tôi không sử dụng Stata (thực tế tôi không bao giờ có). Mặt khác, tôi thích Long, vì vậy tôi đã kiểm tra điều này từ thư viện. Tôi chắc chắn rằng có rất nhiều thông tin tốt trong đó cho mọi người, nhưng nó hoàn toàn đan xen với việc sử dụng Stata đến mức không thể trích xuất thông tin chung về tên miền.
gung - Phục hồi Monica

2

CRISP-DM , được đặt ra bởi công ty SPSS (hiện thuộc về IBM) là từ viết tắt của quy trình khai thác dữ liệu, giống như "phân tích dữ liệu". SAS có một quy trình tương tự gọi là SEMMA .

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.