Có trình duyệt / trình xem tốt để xem tập dữ liệu R (tệp .rda)


38

Tôi muốn duyệt một tập tin .rda (tập dữ liệu R). Tôi biết về View(datasetname)lệnh. R.app mặc định dành cho Mac không có trình duyệt dữ liệu rất tốt (nó mở một cửa sổ trong X11). Tôi thích trình duyệt dữ liệu RStudio mở bằng Viewlệnh. Tuy nhiên, nó chỉ hiển thị 1000 hàng và bỏ qua phần còn lại. ( CẬP NHẬT: Trình xem RStudio hiện hiển thị tất cả các hàng ) Có một trình duyệt tốt sẽ hiển thị tất cả các hàng trong tập dữ liệu và bạn thích / sử dụng.

Câu trả lời:


22

Dưới đây là một vài tùy chọn cơ bản, nhưng cũng giống như bạn, tôi không thể nói rằng tôi hoàn toàn hài lòng với hệ thống hiện tại của mình.

Tránh sử dụng trình xem :

  • Tức là, Sử dụng các công cụ dòng lệnh để duyệt dữ liệu
  • headtailđể hiển thị các hàng ban đầu và cuối cùng
  • str để biết tổng quan về các loại biến
  • dplyr::glimpse()để biết tổng quan về các loại biến của tất cả các cột
  • công cụ khai thác cơ bản muốn [,1:5]hiển thị năm colums đầu tiên
  • Sử dụng máy nhắn tin để hiển thị và điều hướng dữ liệu (ví dụ page(foo, "print"):) có thể kết hợp với một số công cụ trích xuất biến. Điều này hoạt động khá tốt trên Linux, sử dụng less. Tôi không chắc nó hoạt động như thế nào trên Windows hoặc Mac.

Xuất sang phần mềm bảng tính :


(+1) thường xuyên nhất tôi cũng xuất sang bảng tính, đôi khi edit(your_data_object)cũng hữu ích, không chắc chắn về các giới hạn trong các hàng và cột cho chức năng này.
Dmitrij Celov

3
(+1) cũng vậy. Trình duyệt dữ liệu trong Stata không hoàn hảo nhưng đó là một trong những lý do khiến tôi khởi chạy Stata chứ không phải R (Studio) trong nhiều trường hợp.
Cha

1
Trong re: viên đạn thứ hai của bạn, RExcel cố tình làm cho việc truyền dữ liệu giữa R và Excel trở nên liền mạch hơn, mặc dù nó chỉ khả dụng trên Windows. Tôi chưa thử nó (Tôi không dùng Windows); Về cơ bản, tôi hài lòng với write.csv :)
JMS

@Jeromy Pager hoạt động tốt trên Mac.
chl

2
@ Curious2learn: bạn có nghiêm túc xem qua 700 Mb dữ liệu theo cách thủ công không? Hầu hết các tùy chọn do Jeromy ( head, tail, strvv) nên đủ. Nếu bạn muốn có một cái nhìn "lớn hơn" của dữ liệu của bạn ... vẽ nó ( plot, qqplot, histvv)
nico

26

Tôi khuyên bạn nên đánh giá cao các gói liên kết R của googleVis , R với API Trực quan hóa của Google . Các tác giả của Gói là Markus Gesmann và Diego de Castillo.

Trình xem khung dữ liệu trong googleVis rất đơn giản để sử dụng.

Những người này đã làm rất tốt vì googleVis rất dễ sử dụng, mặc dù Google Visualization API thì không.

googleVis có sẵn từ CRAN .

Hàm trong googleVis để hiển thị khung dữ liệu dưới dạng bảng HTML được tạo kiểu là gvisTable () .

Gọi hàm này, chuyển vào khung dữ liệu R sẽ hiển thị các khung dữ liệu R dưới dạng các bảng HTML tương tác ở dạng vừa có chất lượng bảng điều khiển vừa có chức năng.

Một vài tính năng của googleVis / gvisTable tôi đã tìm thấy đặc biệt tốt:

  • để duy trì khả năng phản hồi khi số lượng hàng tăng lên, các giá trị tham số do người dùng chỉ định để phân trang (sử dụng các nút mũi tên); nếu bạn không muốn phân trang, bạn có thể truy cập các hàng bên ngoài chế độ xem thông qua thanh cuộn ở phía bên phải của bảng, theo các tham số được chỉ định trong lệnh gọi hàm gvisTable ()

  • sắp xếp theo cột bằng cách nhấp vào tiêu đề cột

  • các gvisTable trở về cuộc gọi HTML, do đó, nó cầm tay, và mặc dù tôi đã không sử dụng tính năng này, toàn bộ bảng có thể được theo kiểu cách mà bất kỳ bảng HTML đang theo kiểu, với CSS (lớp đầu tiên gán cho bộ chọn có liên quan)

Để sử dụng, chỉ cần nhập Gói googleVis , gọi gvisTable () chuyển qua khung dữ liệu của bạn và liên kết kết quả đó (là đối tượng gvis ) vào một biến; sau đó gọi cốt truyện trên ví dụ gvis đó :

library(googleVis)

gvt = gvisTable(DF)

plot(gvt)

Bạn cũng có thể truyền vào một số tham số, mặc dù bạn thực hiện điều này thông qua một đối số duy nhất cho gvisTable, các tùy chọn , là danh sách R, ví dụ:

gvt = gvisTable(DF, options=list(page='enable', height=300))

Tất nhiên, bạn có thể sử dụng CSS của riêng mình để có được bất kỳ kiểu dáng chi tiết nào bạn muốn.

Khi âm mưu được gọi trên một đối tượng gvis, một cửa sổ trình duyệt sẽ mở ra và bảng sẽ được tải bằng Flash

:


3
Điều này dường như không hoạt động tốt cho các tập dữ liệu vừa và lớn.
Zach

13

RStudio (RStudio.org) có trình xem khung dữ liệu tích hợp khá tốt. May mắn thay, nó chỉ đọc. RStudio rất dễ cài đặt sau khi bạn đã cài đặt phiên bản R. gần đây. Nếu sử dụng Linux trước tiên hãy cài đặt gói r-base.


2
Vâng, tôi thích người xem trong RStudio. Tuy nhiên, như tôi đã nói trong bài viết của mình, nó chỉ hiển thị 1000 hàng đầu tiên. Tôi có thể tăng điều này bằng cách thay đổi một số cài đặt. Tôi đã cố gắng thay đổi max.print, nhưng điều đó không ảnh hưởng đến người xem dữ liệu.
Curious2learn

@ Curious2learm: bạn nên yêu cầu họ thêm tùy chọn này trong phiên bản RStudio tiếp theo trên support.rstudio.org/help/discussions/suggestions Họ thường trả lời trong vòng 2 ngày
RockScience

12

Dưới đây là một số suy nghĩ khác (mặc dù tôi luôn miễn cưỡng rời khỏi Emacs):

  • Deducer (với JGR ) cho phép xem data.frame với chế độ xem biến / dữ liệu kết hợp (à SPSS).
  • Rcmdr của J Fox cũng cung cấp các phương tiện chỉnh sửa / xem, mặc dù trong môi trường X11.
  • Poor Man Gui J Verzani của ( PMG ) chỉ cho phép xem trước nhanh chóng cho data.frame và các đối tượng R khác. Không biết nhiều về khả năng của Rattle .

Dưới đây là hai ảnh chụp màn hình khi xem 704 x 348 data.frame (được tải dưới dạng RData) với Deducer (trên cùng) và Rcmdr (dưới cùng).

nhập mô tả hình ảnh ở đây

nhập mô tả hình ảnh ở đây


9

Bạn có thể nhận được View()để hiển thị tất cả dữ liệu của bạn trong RStudio. Bí quyết là bạn cần sử dụng cú pháp lệnh utils::View()thay thế. (Để biết thêm thông tin, hãy xem câu trả lời của tôi về Stack Overflow tại đây: R View () không hiển thị tất cả các cột của khung dữ liệu .)


Tôi đã viết một hàm đơn giản bằng cách sử dụng hàm utils :: View () cũng hiển thị cho tôi các số cột và đặt nó vào [tệp Rprofile.site] ( statmethods.net/interface/customizing.html ) để chức năng được tải vào R khởi động. Phần tốt nhất là số hàng và tên cột luôn hiển thị. Đây là mã cho chức năng:view <- function(x){ numberColumns <- ncol(x) numbers <- seq(1, numberColumns) names <- names(x) names(x) <- paste0(numbers, "_", names) utils::View(x) }
elevendollar

3

Gần đây tôi bắt đầu giữ dữ liệu trong cơ sở dữ liệu sqlite, truy cập cơ sở dữ liệu trực tiếp từ R bằng cách sử dụng sqldf và xem / chỉnh sửa với một công cụ cơ sở dữ liệu có tên tksqlite

Một tùy chọn khác là xuất dữ liệu và xem / chỉnh sửa bằng Google Refine


Cảm ơn vì thông tin. Tôi sẽ tìm ra cách xuất dữ liệu sang Google Refine và xem điều đó có hoạt động tốt không.
Curious2learn

1
Một công cụ rất gọn gàng khác để xem hoặc chỉnh sửa dữ liệu trong cơ sở dữ liệu sqlite là sqlitebrowser.org
Dominic Comtois

0

Các datatablechức năng từ DTgói tạo bảng HTML. Bạn có thể độc đáo xem các bảng rộng.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.