Làm cách nào tôi có thể đọc trong tệp .csv (không có tiêu đề) và khi tôi chỉ muốn một tập hợp con của các cột (giả sử thứ 4 và thứ 7 trong tổng số 20 cột), sử dụng gấu trúc? Tôi dường như không thể làm đượcusecols
Làm cách nào tôi có thể đọc trong tệp .csv (không có tiêu đề) và khi tôi chỉ muốn một tập hợp con của các cột (giả sử thứ 4 và thứ 7 trong tổng số 20 cột), sử dụng gấu trúc? Tôi dường như không thể làm đượcusecols
Câu trả lời:
Các câu trả lời trước là tốt và chính xác, nhưng theo tôi, một namestham số bổ sung sẽ làm cho nó hoàn hảo, và nó nên là cách được đề xuất, đặc biệt là khi csv không có headers.
usecolsvà namestham sốdf = pd.read_csv(file_path, usecols=[3,6], names=['colA', 'colB'])
hoặc sử dụng header=Noneđể nói rõ với mọi người rằng csvkhông có tiêu đề (dù sao cả hai dòng đều giống nhau )
df = pd.read_csv(file_path, usecols=[3,6], names=['colA', 'colB'], header=None)
Để bạn có thể truy xuất dữ liệu của mình bằng cách
# with `names` parameter
df['colA']
df['colB']
thay vì
# without `names` parameter
df[0]
df[1]
Dựa trên read_csv , khi namesđược thông qua rõ ràng, sau đó headersẽ hành xử như Nonethay vì 0, vì vậy người ta có thể bỏ qua header=Nonekhi namestồn tại.