Giữ ý kiến ​​trên biểu đồ để phân tích dữ liệu thăm dò


8

Khi thực hiện phân tích dữ liệu thăm dò, tôi sẽ thường in ra các biểu đồ và viết ra các bình luận / chú thích, v.v.

Mọi người có đề xuất cho một phương pháp điện tử tốt hơn? Tôi đặc biệt quan tâm đến python / R.

Tôi đang tìm kiếm thứ gì đó 'nhanh (và bẩn)' không làm chậm công việc khám phá, nhưng giúp ghi lại những hiểu biết mà tôi đã thực hiện.

Những gì tôi có thể tưởng tượng là tạo ra các biểu đồ dưới dạng PDF và sau đó thêm nhận xét.

Lý tưởng nhất là tôi muốn tùy chọn thực hiện việc này theo chương trình, để nếu tôi làm lại các biểu đồ, tôi có thể 'tự động' thêm các bình luận trở lại.


1
Những gì tôi đôi khi làm, trong R, là thêm một cốt truyện riêng (trên một trang riêng ở cuối pdf) và sử dụng nó cho pastemột số bình luận.
hplieninger

3
Điều này trông giống như một câu hỏi lập trình và nếu tôi đúng, bạn có thể nhận được phản hồi tốt hơn trên R-help hoặc StackOverflow
mdewey

1
@mdewey, tôi cũng xem đó là quy trình thống kê trong R - Tôi đồng ý 'giải pháp được đề xuất' của tôi chỉ là 'cách viết bình luận cho pdf', nhưng tôi cho rằng các nhà thống kê đã phải đối mặt với vấn đề này trước đây và có thể đề xuất một cách tiếp cận hoàn toàn khác cho vấn đề chung của việc theo dõi các ghi chú liên quan đến đồ thị.
seanv507

3
Học sinh của tôi làm điều này mà không cần nhắc nhở bằng cách dán biểu đồ vào MS Word và thêm nhận xét. Tôi đánh giá cao sự quan tâm đến các phương pháp tự động hát, nhảy hoàn hảo, nhưng đôi khi công nghệ thấp là công nghệ tốt nhất.
Nick Cox

1
Tôi nghĩ rằng đây là lợi ích chung. Tôi đã tự do tưới nước nhấn mạnh vào python / R, trái với hướng dẫn ở đây.
Nick Cox

Câu trả lời:


5

Đây là một giải pháp dễ dàng mà nhiều người đã tìm thấy hữu ích. Nếu bạn thấy nó tầm thường, tôi sẽ không đồng ý. Điều này cắt ngang phần mềm thống kê, hệ điều hành và các chi tiết điện toán khác.

Chỉ cần sao chép và dán biểu đồ của bạn vào trình xử lý văn bản hoặc từ yêu thích của bạn và sau đó thêm nhận xét của riêng bạn. Điều đó có thể có nghĩa là MS Word, phần mềm hỗ trợ TeX, LaTeX, v.v.

Đó là nó. Rõ ràng ưu điểm là sự đơn giản (không có gì mới để học) và tính linh hoạt (thêm những gì bạn muốn theo cách bạn muốn).

Đây không phải là một giải pháp tự động. Nhưng ngay cả các giải pháp tự động phụ thuộc vào việc được cung cấp thông tin trên biểu đồ và nhận xét của bạn, vậy điều đó có gì khác biệt?


2
Tôi nghĩ rằng bạn đang đánh giá thấp nó. Nếu thay vì 'dán', bạn thêm một liên kết vào một tệp (như bạn có thể trong từ latex, v.v.) thì khi các biểu đồ được cập nhật các bản cập nhật tài liệu - vì vậy 'tự động'. Ngoài ra, tôi thích thực tế là người ta có thể tách việc tạo các biểu đồ khỏi bố cục (ví dụ: khớp 3 biểu đồ trên một trang so với bố cục 2 x 2)
seanv507

3

Tôi đặc biệt khuyên dùng Jupyter Notebook , cho phép bạn tạo các tài liệu có chứa các khối mã, lô và ghi chú / tài liệu xen kẽ. Tài liệu có thể bao gồm markdown và latex, được tự động hiển thị (giống như viết trên CrossValidated). Khi bạn chạy một khối mã, mọi đầu ra văn bản và các ô mà nó tạo ra sẽ được thêm vào nội tuyến vào tài liệu. Bạn có thể thay đổi một khối mã và chạy lại để cập nhật đầu ra / lô. Điều này là tốt để kiểm tra mọi thứ một cách tương tác (ví dụ: điều chỉnh mã / tham số để xem điều gì xảy ra). Tôi nghĩ rằng nó dễ hơn là phải xuất các số liệu và dán chúng vào một tài liệu tĩnh, truyền thống, đặc biệt nếu bạn thay đổi bất cứ điều gì. Bạn có thể xuất sổ ghi chép sang PDF, v.v. để lấy bản sao tĩnh.

Nó là nguồn mở và hoạt động với Python, R và các ngôn ngữ khác. Giao diện dựa trên trình duyệt, vì vậy nó đa nền tảng và dễ dàng chia sẻ sổ ghi chép. Bạn có thể chạy phụ trợ trên máy của mình hoặc bạn có thể lưu trữ sổ ghi chép trên trang web để bạn / người khác có thể chỉnh sửa / xem / chạy chúng từ bất cứ đâu (mã sẽ chạy trên máy chủ). Rõ ràng có một cách để cấu hình máy tính xách tay làm lối vào một cụm tính toán cho các tính toán song song.


Tôi đã thử điều đó trong nhiều trường hợp, nhưng tôi không thực sự tin rằng nó hoạt động rất tốt: Kết hợp mã / đồ họa / tài liệu trong khi đảm bảo mọi thứ có thể đọc được dường như rất khó trong thực tế. Tôi đã thấy các bài thuyết trình trong đó điều này đã được thực hiện nhưng nghi ngờ nỗ lực liên quan là đáng kể (như đối với bất kỳ bài thuyết trình nào). Quan điểm của tôi về EDA là bạn đang thực hiện rất nhiều biểu đồ, v.v. - quá nhiều để trình bày ... trong một bài thuyết trình bạn thể hiện tốt nhất. Sẽ hoan nghênh các ví dụ mâu thuẫn với ấn tượng của tôi.
seanv507

2

Tôi có xu hướng thực hiện nhiều phân tích hơn R notebookstrong RStudio. Bằng cách này, tôi có thể có mã, chú thích và đồ thị ở cùng một nơi và không phải tạo pdf mọi lúc - đó là một trình tiết kiệm thời gian thực. Bạn viết văn bản và mã trong một trình soạn thảo và bằng cách nhấp vào nút, mã được thực thi (và biểu đồ được vẽ) tại chỗ. Vì vậy, văn bản, mã và cốt truyện ở lại với nhau gọn gàng. Nó cũng rất dễ dàng để chuyển đổi thành HTML hoặc PDF bằng một số lần nhấp chuột. Tôi không biết, cái này hoạt động tốt như thế nào với Python, vì tôi chủ yếu sử dụng R.


2

Có vẻ như bạn muốn một số loại lập trình biết chữ . Rdành Sweave , và Knitr rằng giao diện với LaTeX . Có các tùy chọn khác cho các loại định dạng đầu ra khác nhau, chẳng hạn như ODFweave cho các tài liệu có thể chỉnh sửa (như tài liệu Word) và RMarkdown có thể xuất nhiều loại (như HTML ngoài các loại đã đề cập ở trên). Phần mềm thống kê khác thường có tính năng tương tự.

(Có một chút công việc trước mắt trong việc sử dụng chúng. Tôi thường thực hiện các dự án một lần thay vì các dự án dài hạn yêu cầu báo cáo thường xuyên và tương tự, vì vậy tôi thường sử dụng phương pháp đổ hoặc sao chép của @ NickCox vào một tệp và viết bình luận xung quanh nó.)


1

Trong R: Đôi khi tôi thêm một âm mưu bổ sung vào pdf với một số thông tin cơ bản. Điều này hữu ích nhất nếu các chú thích ngắn và liên quan đến dữ liệu cốt truyện để bạn có thể pastethêm thông tin. Ví dụ:

pdf("cars-plots.pdf")
plot(cars)
plot.new()
legend("center", bty = "n", legend =
           paste0("Data: 'cars'\n",
                  "cor = ", round(cor(cars)[1, 2], 2), "\n",
                  "N = ", nrow(cars), "\n",
                  Sys.Date()))
dev.off()

Ngoài ra, nếu bạn có chú thích dài hơn, tạo báo cáo bằng R Markdown có thể là một giải pháp.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.