Đối với một giải pháp không có phụ thuộc bên ngoài khó hiểu *, bây giờ có readxl
:
Gói readxl giúp dễ dàng lấy dữ liệu ra khỏi Excel và sang R. So với nhiều gói hiện có (ví dụ: gdata, xlsx, xlsReadWrite) readxl không có phụ thuộc bên ngoài nên rất dễ cài đặt và sử dụng trên tất cả các hệ điều hành. Nó được thiết kế để làm việc với dữ liệu dạng bảng được lưu trữ trong một trang tính.
Readxl hỗ trợ cả định dạng .xls kế thừa và định dạng .xlsx dựa trên xml hiện đại. Hỗ trợ .xls có thể thực hiện được với thư viện libxls C, thư viện này loại bỏ nhiều phức tạp của định dạng nhị phân cơ bản. Để phân tích cú pháp .xlsx, chúng tôi sử dụng thư viện RapidXML C ++.
Nó có thể được cài đặt như vậy:
install.packages("readxl") # CRAN version
hoặc là
devtools::install_github("hadley/readxl") # development version
Sử dụng
library(readxl)
# read_excel reads both xls and xlsx files
read_excel("my-old-spreadsheet.xls")
read_excel("my-new-spreadsheet.xlsx")
# Specify sheet with a number or name
read_excel("my-spreadsheet.xls", sheet = "data")
read_excel("my-spreadsheet.xls", sheet = 2)
# If NAs are represented by something other than blank cells,
# set the na argument
read_excel("my-spreadsheet.xls", na = "NA")
* không hoàn toàn đúng, nó yêu cầu Rcpp
gói , do đó yêu cầu Rtools (cho Windows) hoặc Xcode (cho OSX), là các phần phụ thuộc bên ngoài R. Nhưng chúng không yêu cầu bất kỳ lần mò đường dẫn nào, v.v., vì vậy đó là lợi thế hơn các phụ thuộc Java và Perl.
Cập nhật Hiện có gói hủy bỏ . Điều này hứa hẹn nhận được định dạng Excel, các hàm và nhiều loại thông tin khác từ tệp Excel và sang R.
.csv
.