Tôi muốn hợp nhất một số chuỗi trong khung dữ liệu dựa trên một nhóm trong Pandas.
Đây là mã của tôi cho đến nay:
import pandas as pd
from io import StringIO
data = StringIO("""
"name1","hej","2014-11-01"
"name1","du","2014-11-02"
"name1","aj","2014-12-01"
"name1","oj","2014-12-02"
"name2","fin","2014-11-01"
"name2","katt","2014-11-02"
"name2","mycket","2014-12-01"
"name2","lite","2014-12-01"
""")
# load string as stream into dataframe
df = pd.read_csv(data,header=0, names=["name","text","date"],parse_dates=[2])
# add column with month
df["month"] = df["date"].apply(lambda x: x.month)
Tôi muốn kết quả cuối cùng trông như thế này:
Tôi không hiểu cách sử dụng groupby và áp dụng một số kiểu nối các chuỗi trong cột "văn bản". Bất kỳ sự giúp đỡ nào được đánh giá cao!
pandas < 1.0
,.drop_duplicates()
bỏ qua chỉ mục, có thể cho kết quả không mong muốn. Bạn có thể tránh điều này bằng cách sử dụng.agg(lambda x: ','.join(x))
thay vì.transform().drop_duplicates()
.