Tôi có một khung dữ liệu với một cột được gọi "Date"
và muốn tất cả các giá trị từ cột này có cùng giá trị (chỉ năm). Thí dụ:
City Date
Paris 01/04/2004
Lisbon 01/09/2004
Madrid 2004
Pekin 31/2004
Điều tôi muốn là:
City Date
Paris 2004
Lisbon 2004
Madrid 2004
Pekin 2004
Đây là mã của tôi:
fr61_70xls = pd.ExcelFile('AMADEUS FRANCE 1961-1970.xlsx')
#Here we import the individual sheets and clean the sheets
years=(['1961','1962','1963','1964','1965','1966','1967','1968','1969','1970'])
fr={}
header=(['City','Country','NACE','Cons','Last_year','Op_Rev_EUR_Last_avail_yr','BvD_Indep_Indic','GUO_Name','Legal_status','Date_of_incorporation','Legal_status_date'])
for year in years:
# save every sheet in variable fr['1961'], fr['1962'] and so on
fr[year]=fr61_70xls.parse(year,header=0,parse_cols=10)
fr[year].columns=header
# drop the entire Legal status date column
fr[year]=fr[year].drop(['Legal_status_date','Date_of_incorporation'],axis=1)
# drop every row where GUO Name is empty
fr[year]=fr[year].dropna(axis=0,how='all',subset=[['GUO_Name']])
fr[year]=fr[year].set_index(['GUO_Name','Date_of_incorporation'])
Điều xảy ra là trong DataFrames của tôi, được gọi là ví dụ, fr['1961']
các giá trị của Date_of_incorporation
có thể là bất kỳ thứ gì (chuỗi, số nguyên, v.v.), vì vậy có lẽ tốt nhất là xóa hoàn toàn cột này và sau đó gắn một cột khác chỉ có năm vào DataFrames?