Chúng tôi có khung dữ liệu từ tệp CSV. Khung dữ liệu DF
có các cột chứa các giá trị quan sát và một cột ( VaR2
) chứa ngày thực hiện phép đo. Nếu ngày không được ghi lại, thì tệp CSV chứa giá trị NA
cho dữ liệu bị thiếu.
Var1 Var2
10 2010/01/01
20 NA
30 2010/03/01
Chúng tôi muốn sử dụng lệnh tập hợp con để xác định một khung dữ liệu mới new_DF
sao cho nó chỉ chứa các hàng có NA'
giá trị từ cột ( VaR2
). Trong ví dụ đã cho, chỉ Hàng 2 mới được chứa trong hàng mới DF
.
Lệnh
new_DF<-subset(DF,DF$Var2=="NA")
không hoạt động, khung dữ liệu kết quả không có mục nhập hàng.
Nếu trong file CSV gốc giá trị NA
được trao đổi với NULL
, lệnh cùng tạo ra kết quả mong muốn: new_DF<-subset(DF,DF$Var2=="NULL")
.
Làm cách nào để phương pháp này hoạt động, nếu đối với chuỗi ký tự, giá trị NA
được cung cấp trong tệp CSV gốc?