Ai theo dõi trên github để tìm hiểu về thực tiễn tốt nhất trong phân tích dữ liệu?


28

Nó rất hữu ích để nghiên cứu mã phân tích dữ liệu của các chuyên gia. Gần đây tôi đã hiểu được github và có một số người chia sẻ mã phân tích dữ liệu ở đó. Điều này bao gồm một vài Gói R (tất nhiên có sẵn trực tiếp từ CRAN), nhưng cũng có một số ví dụ về nghiên cứu có thể tái tạo, đặc biệt là sử dụng R ( xem danh sách R này trên github ).

  • Ai là người tốt để theo dõi trên github để tìm hiểu về thực tiễn tốt nhất trong phân tích dữ liệu?
  • Tùy chọn, loại mã nào họ chia sẻ và tại sao điều này hữu ích?

Câu trả lời:


18

Hadley Wickham . Anh ta có một số dự án phân tích dữ liệu khám phá trên Github mà bạn có thể xem (ví dụ: "data-baby-name") và đưa ra sự tuyệt vời của ggplot2 / plyr / reshape, tôi có một sự tin tưởng mặc định (nhưng bị mù) thực hành, đặc biệt là đối với các gói riêng của mình.

Thêm vào đó, bạn sẽ sớm có được những dự án khác mà anh ấy đang thực hiện!


5
(+1) Anh ấy cũng đang làm việc với một bộ hướng dẫn về phát triển Advanced R , rất tiện dụng!
chl

@Jeromy Trên thực tế, có vẻ như đây chỉ là một cách để phác thảo sách giáo khoa trong tương lai của anh ấy (kiểm tra các tweet trước đây của CTNH).
chl

9

Tôi cũng theo dõi kho GitHub của John Myles White . Có một số dự án hướng dữ liệu, nhưng cũng là thứ thú vị cho các nhà phát triển R:

  • ProjectTemplate , một hệ thống mẫu để xây dựng dự án R;
  • log4r , một hệ thống đăng nhập.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.