Câu hỏi được gắn thẻ «data.table»

Gói R data.table là một phần mở rộng của data.frame được xây dựng để phân tích dữ liệu trong bộ nhớ nhanh chóng. Sử dụng thẻ dt cho gói DataTables với Shiny (DT).

8
Chuyển đổi các lớp cột trong data.table
Tôi gặp sự cố khi sử dụng data.table: Làm cách nào để chuyển đổi các lớp cột? Đây là một ví dụ đơn giản: Với data.frame, tôi không gặp sự cố khi chuyển đổi nó, với data.table, tôi chỉ không biết làm thế nào: df <- data.frame(ID=c(rep("A", 5), rep("B",5)), Quarter=c(1:5, …
118 r  data.table 

2
Mục đích của việc thiết lập khóa trong data.table là gì?
Tôi đang sử dụng data.table và có nhiều chức năng yêu cầu tôi đặt khóa (ví dụ X[Y]:). Do đó, tôi muốn hiểu khóa làm gì để đặt đúng khóa trong bảng dữ liệu của mình. Tôi đã đọc một nguồn ?setkey. setkey()sắp xếp a data.tablevà đánh dấu là đã …
113 r  data.table 

8
Xóa các giá trị `Inf` khỏi khung dữ liệu R
Trong R, tôi có một phép toán tạo ra một số Infgiá trị khi tôi chuyển đổi khung dữ liệu. Tôi muốn biến những Infgiá trị này thành NAgiá trị. Mã tôi có chậm đối với dữ liệu lớn, có cách nào nhanh hơn để làm điều này không? Giả …
101 r  dataframe  data.table 


6
Nhận các giá trị hàng đầu theo nhóm
Đây là khung dữ liệu mẫu: d <- data.frame( x = runif(90), grp = gl(3, 30) ) Tôi muốn tập hợp con dchứa các hàng có 5 giá trị hàng đầu xcho mỗi giá trị của grp. Sử dụng base-R, cách tiếp cận của tôi sẽ như sau: ordered <- …
92 r  data.table  dplyr 




5
Tách chuỗi văn bản trong một cột data.table
Tôi có một tập lệnh đọc dữ liệu từ tệp CSV thành một data.tablevà sau đó chia văn bản trong một cột thành nhiều cột mới. Tôi hiện đang sử dụng các hàm lapplyvà strsplitđể làm việc này. Đây là một ví dụ: library("data.table") df = data.table(PREFIX = c("A_B","A_C","A_D","B_A","B_C","B_D"), VALUE …
86 r  data.table 






5
data.table nội suy tuyến tính các giá trị NA không có nhóm
Tôi muốn điền một số giá trị NA vào data.table mà không có nhóm. Vui lòng xem xét trích xuất dữ liệu này. Biểu thị thời gian và khoảng cách: library(data.table) df <- data.frame(time = seq(7173, 7195, 1), dist = c(31091.33, NA, 31100.00, 31103.27, NA, NA, NA, NA, 31124.98, NA,31132.81, …
18 r  data.table 

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.