Làm cách nào tôi có thể chuyển đổi một cột DataFrame của chuỗi (ở định dạng dd / mm / yyyy ) thành datetimes?
Làm cách nào tôi có thể chuyển đổi một cột DataFrame của chuỗi (ở định dạng dd / mm / yyyy ) thành datetimes?
Câu trả lời:
Cách dễ nhất là sử dụng to_datetime
:
df['col'] = pd.to_datetime(df['col'])
Nó cũng đưa ra một dayfirst
lập luận cho thời đại châu Âu (nhưng hãy cẩn thận điều này không nghiêm ngặt ).
Đây là hành động:
In [11]: pd.to_datetime(pd.Series(['05/23/2005']))
Out[11]:
0 2005-05-23 00:00:00
dtype: datetime64[ns]
Bạn có thể vượt qua một định dạng cụ thể :
In [12]: pd.to_datetime(pd.Series(['05/23/2005']), format="%m/%d/%Y")
Out[12]:
0 2005-05-23
dtype: datetime64[ns]
DatetimeIndex(df['col']).to_pydatetime()
nên hoạt động.
SettingWithCopyWarning
đủ tài liệu
Nếu cột ngày của bạn là một chuỗi có định dạng '2017-01-01', bạn có thể sử dụng pandas astype để chuyển đổi nó thành datetime.
df['date'] = df['date'].astype('datetime64[ns]')
hoặc sử dụng datetime64 [D] nếu bạn muốn độ chính xác của Ngày và không phải là nano giây
print(type(df_launath['date'].iloc[0]))
sản lượng
<class 'pandas._libs.tslib.Timestamp'>
giống như khi bạn sử dụng pandas.to_datetime
Bạn có thể thử nó với các định dạng khác sau đó '% Y-% m-% d' nhưng ít nhất điều này hoạt động.
Bạn có thể sử dụng như sau nếu bạn muốn chỉ định các định dạng phức tạp:
df['date_col'] = pd.to_datetime(df['date_col'], format='%d/%m/%Y')
Thêm chi tiết tại format
đây:
Nếu bạn có một hỗn hợp các định dạng trong ngày của mình, đừng quên thiết lập infer_datetime_format=True
để làm cho cuộc sống dễ dàng hơn
df['date'] = pd.to_datetime(df['date'], infer_datetime_format=True)
Nguồn: pd.to_datetime
hoặc nếu bạn muốn một cách tiếp cận tùy chỉnh:
def autoconvert_datetime(value):
formats = ['%m/%d/%Y', '%m-%d-%y'] # formats to try
result_format = '%d-%m-%Y' # output format
for dt_format in formats:
try:
dt_obj = datetime.strptime(value, dt_format)
return dt_obj.strftime(result_format)
except Exception as e: # throws exception when format doesn't match
pass
return value # let it be if it doesn't match
df['date'] = df['date'].apply(autoconvert_datetime)