Làm cách nào tôi có thể đọc trong tệp .csv (không có tiêu đề) và khi tôi chỉ muốn một tập hợp con của các cột (giả sử thứ 4 và thứ 7 trong tổng số 20 cột), sử dụng gấu trúc? Tôi dường như không thể làm đượcusecols
Làm cách nào tôi có thể đọc trong tệp .csv (không có tiêu đề) và khi tôi chỉ muốn một tập hợp con của các cột (giả sử thứ 4 và thứ 7 trong tổng số 20 cột), sử dụng gấu trúc? Tôi dường như không thể làm đượcusecols
Câu trả lời:
Các câu trả lời trước là tốt và chính xác, nhưng theo tôi, một names
tham số bổ sung sẽ làm cho nó hoàn hảo, và nó nên là cách được đề xuất, đặc biệt là khi csv không có headers
.
usecols
và names
tham sốdf = pd.read_csv(file_path, usecols=[3,6], names=['colA', 'colB'])
hoặc sử dụng header=None
để nói rõ với mọi người rằng csv
không có tiêu đề (dù sao cả hai dòng đều giống nhau )
df = pd.read_csv(file_path, usecols=[3,6], names=['colA', 'colB'], header=None)
Để bạn có thể truy xuất dữ liệu của mình bằng cách
# with `names` parameter
df['colA']
df['colB']
thay vì
# without `names` parameter
df[0]
df[1]
Dựa trên read_csv , khi names
được thông qua rõ ràng, sau đó header
sẽ hành xử như None
thay vì 0
, vì vậy người ta có thể bỏ qua header=None
khi names
tồn tại.