Những gói R nào bạn thấy hữu ích nhất trong công việc hàng ngày của bạn?


28

Chủ đề trùng lặp: Tôi vừa cài đặt phiên bản mới nhất của R. Tôi nên mua gói nào?

Các gói R bạn không thể tưởng tượng được công việc hàng ngày của bạn với dữ liệu là gì? Vui lòng liệt kê cả các công cụ chung và cụ thể.

CẬP NHẬT: Cho đến ngày 24.10.10 ggplot2dường như là người chiến thắng với 7 phiếu.

Các gói khác được đề cập nhiều hơn một là:

  • plyr - 4
  • RODBC, RMySQL- 4
  • sqldf - 3
  • lattice - 2
  • zoo - 2
  • Hmisc/rms - 2
  • Rcurl - 2
  • XML - 2

Cảm ơn tất cả các câu trả lời của bạn!


1
Câu hỏi rất chủ quan: câu hỏi này không thể được trả lời, và không phù hợp với trang web QA.
Egon Willighagen

3
Có lẽ nên là wiki cộng đồng; câu hỏi hữu ích ở đây nhưng không có câu trả lời dứt khoát.
Shane

2
@Shane: điểm tốt. di chuyển. @ Egon: chủ quan thực sự. nhưng nếu câu trả lời đến từ những người hiểu biết thì tôi không bận tâm đến sự chủ quan. Tôi đã bắt đầu học R gần đây và có vài chục cài đặt để khám phá, tuy nhiên tôi nhận thấy rằng có những công cụ mà tôi sử dụng thường xuyên hơn một cách thiếu tôn trọng nhiệm vụ trong tay.
radek

Sẽ rất thú vị nếu StackExchange có thể hỗ trợ một số phương pháp liên kết các bài đăng wiki cộng đồng trên các trang web. Bởi vì tôi sẽ đặt cược câu hỏi này đã được hỏi trên Stackoverflow và tôi cũng nghĩ rằng Phân tích thống kê có thể thu hút một số người thường không ghé thăm SO.
Sharpie

@Sharpie: đã có một số bài viết SO thú vị như stackoverflow.com/questions/1295955/ trên hoặc stackoverflow.com/questions/1535021/ Tuy nhiên họ không tập trung vào các gói. và tôi đồng ý, liên kết của wiki cộng đồng có thể thực sự hữu ích.
radek

Câu trả lời:



23

Tôi sử dụng plyrggplot2 nhiều nhất trên một cơ sở hàng ngày.

Tôi cũng phụ thuộc rất nhiều vào các gói chuỗi thời gian; Đặc biệt nhất là gói sở thú .


8

Tôi sử dụng gói xtable . Gói xtable biến các bảng được tạo bởi R (đặc biệt là các bảng hiển thị kết quả anova) thành các bảng LaTeX, được đưa vào một bài viết.



8

ggplot2 - trực quan hóa tốt nhất cho R.

RMySQL / RSQLite / RODBC - để kết nối với cơ sở dữ liệu

sqldf - thao tác data.frames với các truy vấn SQL

Hmisc / rms - các gói từ Frank Harrell chứa các hàm linh tinh tiện lợi và các hàm đẹp để phân tích hồi quy.

GenABEL - gói đẹp cho các nghiên cứu kết hợp trên toàn bộ gen

Rcmdr - một GUI tốt cho R nếu bạn cần.

Ngoài ra hãy xem CRANtastic - liên kết này có một danh sách các gói R phổ biến nhất. Nhiều người đứng đầu danh sách đã được đề cập


8

data.table là yêu thích của tôi bây giờ! Rất mong chờ phiên bản mới với danh sách mong muốn được triển khai nhiều hơn.



6

Đối với cá nhân tôi, tôi sử dụng ba gói sau nhiều nhất, tất cả đều có sẵn từ Dự án Omega tuyệt vời cho máy tính thống kê (tôi không tự nhận là chuyên gia, nhưng với mục đích của tôi, chúng rất dễ sử dụng):

  • RCurl : Nó có rất nhiều tùy chọn cho phép truy cập vào các trang web mà các chức năng mặc định trong cơ sở R sẽ gặp khó khăn với tôi nghĩ rằng thật công bằng khi nói. Nó là một giao diện R cho thư viện libcurl, có thêm lợi ích của cả một cộng đồng bên ngoài R phát triển nó. Cũng có sẵn trên CRAN .

  • XML : Rất tha thứ cho việc phân tích cú pháp XML / HTML không đúng định dạng. Nó là một giao diện R cho thư viện libxml2 và một lần nữa có thêm lợi ích của cả một cộng đồng bên ngoài R phát triển nó Cũng có sẵn trên CRAN .

  • RJSONIO : Nó cho phép một người phân tích văn bản được trả về từ một cuộc gọi json và sắp xếp nó thành một cấu trúc danh sách để phân tích thêm. Đối thủ của gói này là rjson nhưng điều này có lợi thế là được vector hóa, có thể mở rộng nhanh chóng qua S3 / S4, nhanh chóng và có thể mở rộng để dữ liệu lớn.

6

Vuốt cho phép bạn nhúng mã R trong tài liệu LaTeX. Các kết quả của việc thực thi mã và tùy chọn mã nguồn trở thành một phần của tài liệu cuối cùng.

Vì vậy, thay vì, ví dụ, dán hình ảnh do R tạo ra vào tệp LaTeX, bạn có thể dán R vào tệp và giữ mọi thứ ở một nơi.


4
Chỉ là một gợi ý cho tất cả những ai muốn bắt đầu nghiên cứu tái sản xuất với R. Tôi sẽ khuyên bạn nên xem qua gói mới knitrthay vì Sweave. Về cơ bản, nó là Sweave trên steroid. Nó là dễ dàng, nếu không dễ dàng hơn, để học và linh hoạt hơn nhiều.
Christoph_J


4

Tôi tìm thấy mạng tinh thể cùng với cuốn sách đồng hành "Lưới: Trực quan hóa dữ liệu đa biến với R" của Deepayan Sarkar là vô giá.


4

Nếu bạn đang làm bất kỳ loại mô hình dự đoán nào, caret là một ơn trời. Đặc biệt kết hợp với gói đa lõi , một số điều khá tuyệt vời là có thể.


4

Gói hàng ngày hữu ích nhất phải là "nước ngoài" có chức năng đọc và ghi dữ liệu cho các gói thống kê khác, chẳng hạn như Stata, SPSS, Minitab, SAS, v.v. Làm việc trong một lĩnh vực mà R không phổ biến có nghĩa là điều này là một gói rất quan trọng.


3

tôi sử dụng

xe hơi, doBy, Epi, ggplot2, gregmisc (gdata, gmodels, gplots, gtools), Hmisc, plyr, RCurl, RDCOMClient, định hình lại, RODBC, DạyDemos, XML.

rất nhiều.


3

Tôi không thể sống thiếu:

  • lưới cho đồ họa
  • xlsx hoặc XLConnect để đọc tệp Excel
  • rtf để tạo báo cáo ở định dạng rtf (tôi thích Sword hoặc R2wd nhưng tôi không thể cài đặt statconn tại nơi làm việc; tôi chắc chắn sẽ thử odfWeave sớm.)
  • nlmelme4 cho các mô hình hỗn hợp
  • ff để làm việc với các mảng lớn

2

RODBC để truy cập dữ liệu từ cơ sở dữ liệu, sqldf để thực hiện các truy vấn SQL đơn giản trên dataframes (mặc dù tôi buộc bản thân mình để sử dụng lệnh R mẹ đẻ), và ggplot2plyr



2

Chúng tôi chủ yếu sử dụng:

  • ggplot - cho các biểu đồ
  • số liệu thống kê
  • e1071 - cho các SVM

Bạn cũng có thể muốn kiểm tra kernlab và caret cho SVM. Chúng là những lựa chọn thay thế thú vị (không nhất thiết phải tốt hơn).
Zach


2

Đối với tôi, tôi đang sử dụng kernlab cho Machine Learning Lab dựa trên Kernel và e1071 cho SVM và ggplot2 cho đồ họa


2

Tôi sử dụng ggplot2, thuần chay và định hình lại khá thường xuyên.



2

RColorBrewer chưa được đề cập ở đây, tôi thường sử dụng nó cho âm mưu nếu tôi cần phối màu


2

Tôi là một fan hâm mộ lớn của RCPP khi tôi cần một vòng lặp nhanh chóng hoặc để thực hiện các phương pháp điều trị không tuân thủ rất R. Nó được triển khai rất tốt trong hệ sinh thái R, có thể nhận Ma trận / Ma trận thưa thớt mà không cần chuyển đổi làm đối số trong một hàm.

Cú pháp C ++ rất dễ dàng khi bạn đang làm những việc đơn giản (thường là trường hợp của tôi).

Thực sự, bạn không cần phải là một nhà sản xuất gói để cần lib tuyệt vời này.

Tôi đã nói C ++ rất nhanh phải không?


2

Các gói doParallelforeach đã giúp cuộc sống của tôi dễ dàng hơn rất nhiều bằng cách cho phép tôi song song mã của mình và chạy nó trên một phiên bản được tối ưu hóa tính toán trên Amazon EC2 ! Tôi sử dụng chúng rất thường xuyên. Nhưng điều đó sẽ không thể xảy ra nếu không có RStudio AMIs được phát hành bởi Louis Aslett. Cuối cùng, tôi phải đề cập đến gói Stringr thực sự làm việc với chuỗi đi bộ trong công viên. Sử dụng nó trong mọi ứng dụng khai thác văn bản. Và tôi cũng sử dụng đan rất thường xuyên để tạo ra các báo cáo chất lượng cao về công việc của mình. Rất cám ơn cho gói tuyệt vời này Yihui Xie!


1

Tôi sử dụng ggplot2, định hình lại, mạng, đan thường xuyên hơn.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.