Có ai có bất kỳ sự khôn ngoan nào trong quy trình làm việc để phân tích dữ liệu liên quan đến viết báo cáo tùy chỉnh không? Ca sử dụng về cơ bản là thế này:
Khách hàng ủy thác một báo cáo sử dụng phân tích dữ liệu, ví dụ ước tính dân số và bản đồ liên quan cho một quận nước.
Nhà phân tích tải xuống một số dữ liệu, trộn dữ liệu và lưu kết quả (ví dụ: thêm một cột cho dân số trên mỗi đơn vị hoặc đặt lại dữ liệu dựa trên ranh giới quận).
Nhà phân tích phân tích dữ liệu được tạo trong (2), gần với mục tiêu của cô ấy, nhưng thấy rằng cần nhiều dữ liệu hơn và do đó quay trở lại (1).
Rửa lặp lại cho đến khi các bảng và đồ họa đáp ứng QA / QC và đáp ứng máy khách.
Viết báo cáo kết hợp bảng và đồ họa.
Năm tới, khách hàng vui vẻ quay lại và muốn cập nhật. Điều này sẽ đơn giản như cập nhật dữ liệu ngược dòng bằng cách tải xuống mới (ví dụ: lấy giấy phép xây dựng từ năm ngoái) và nhấn nút "RECALCULATE", trừ khi thông số kỹ thuật thay đổi.
Hiện tại, tôi chỉ bắt đầu một thư mục và quảng cáo nó tốt nhất có thể. Tôi muốn một cách tiếp cận có hệ thống hơn, vì vậy tôi hy vọng ai đó đã tìm ra điều này ... Tôi sử dụng hỗn hợp các công cụ bảng tính, SQL, ARCGIS, R và Unix.
Cảm ơn!
Tái bút
Dưới đây là một Makefile cơ bản kiểm tra sự phụ thuộc vào các bộ dữ liệu trung gian khác nhau (w / .RData
hậu tố) và tập lệnh ( .R
hậu tố). Sử dụng dấu thời gian để kiểm tra các phụ thuộc, vì vậy nếu bạn touch ss07por.csv
, nó sẽ thấy rằng tệp này mới hơn tất cả các tệp / mục tiêu phụ thuộc vào nó và thực thi các tập lệnh đã cho để cập nhật chúng theo. Đây vẫn là một công việc đang tiến triển, bao gồm một bước để đưa vào cơ sở dữ liệu SQL và một bước cho một ngôn ngữ tạo khuôn mẫu như sweave. Lưu ý rằng Make dựa vào các tab theo cú pháp của nó, vì vậy hãy đọc hướng dẫn trước khi cắt và dán. Thưởng thức và đưa ra phản hồi!
http://www.gnu.org/software/make/manual/html_node/index.html#Top
R = / nhà / wsprague / R-2.9.2 / thùng / R Persondata.RData: ImportData.R ../../DATA/ss07por.csv Hàm.R $ R --slave -f ImportData.R Persondata.Munged.RData: MungeData.R Persondata.RData Hàm.R $ R --slave -f MungeData.R report.txt: TabulationAndGraph.R Persondata.Munged.RData Hàm.R $ R --slave -f TabulationAndGraph.R> report.txt