từ doc pandas http://pandas.pydata.org/pandas-docs/urdy/dsintro.html
Sê-ri là một mảng được dán nhãn một chiều có khả năng chứa bất kỳ loại dữ liệu nào. Để đọc dữ liệu dưới dạng loạt gấu trúc:
import pandas as pd
ds = pd.Series(data, index=index)
DataFrame là cấu trúc dữ liệu được gắn nhãn 2 chiều với các cột có khả năng khác nhau.
import pandas as pd
df = pd.DataFrame(data, index=index)
Trong cả hai chỉ số trên là danh sách
ví dụ: Tôi có tệp csv với dữ liệu sau:
,country,popuplation,area,capital
BR,Brazil,10210,12015,Brasile
RU,Russia,1025,457,Moscow
IN,India,10458,457787,New Delhi
Để đọc dữ liệu trên dưới dạng chuỗi và khung dữ liệu:
import pandas as pd
file_data = pd.read_csv("file_path", index_col=0)
d = pd.Series(file_data.country, index=['BR','RU','IN'] or index = file_data.index)
đầu ra:
>>> d
BR Brazil
RU Russia
IN India
df = pd.DataFrame(file_data.area, index=['BR','RU','IN'] or index = file_data.index )
đầu ra:
>>> df
area
BR 12015
RU 457
IN 457787