Tôi đang sử dụng thư viện gấu trúc để đọc một số dữ liệu CSV. Trong dữ liệu của tôi, các cột nhất định chứa các chuỗi. Chuỗi "nan"
là một giá trị có thể có, cũng như một chuỗi rỗng. Tôi đã quản lý để gấu trúc đọc "nan" dưới dạng một chuỗi, nhưng tôi không thể tìm ra cách làm cho nó không đọc giá trị trống là NaN. Đây là dữ liệu mẫu và kết quả đầu ra
One,Two,Three
a,1,one
b,2,two
,3,three
d,4,nan
e,5,five
nan,6,
g,7,seven
>>> pandas.read_csv('test.csv', na_values={'One': [], "Three": []})
One Two Three
0 a 1 one
1 b 2 two
2 NaN 3 three
3 d 4 nan
4 e 5 five
5 nan 6 NaN
6 g 7 seven
Nó đọc một cách chính xác "nan" như chuỗi "nan', nhưng vẫn đọc ô trống như NaN. Tôi cố gắng đi qua trong str
trong converters
lập luận để read_csv (với converters={'One': str})
), nhưng nó vẫn đọc ô trống như NaN.
Tôi nhận ra rằng tôi có thể điền các giá trị sau khi đọc, bằng fillna, nhưng thực sự không có cách nào để nói với gấu trúc rằng một ô trống trong một cột CSV cụ thể nên được đọc dưới dạng chuỗi trống thay vì NaN?
keep_default_na
bên dưới.