Tôi có một khung dữ liệu như thế này:
A B C
0 1 0.749065 This
1 2 0.301084 is
2 3 0.463468 a
3 4 0.643961 random
4 1 0.866521 string
5 2 0.120737 !
Kêu gọi
In [10]: print df.groupby("A")["B"].sum()
sẽ trở lại
A
1 1.615586
2 0.421821
3 0.463468
4 0.643961
Bây giờ tôi muốn làm "tương tự" cho cột "C". Bởi vì cột đó chứa các chuỗi, sum () không hoạt động (mặc dù bạn có thể nghĩ rằng nó sẽ nối các chuỗi). Những gì tôi thực sự muốn xem là danh sách hoặc tập hợp các chuỗi cho mỗi nhóm, tức là
A
1 {This, string}
2 {is, !}
3 {a}
4 {random}
Tôi đã cố gắng tìm cách để làm điều này.
Series.unique () ( http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.unique.html ) không hoạt động, mặc dù
df.groupby("A")["B"]
là một
pandas.core.groupby.SeriesGroupBy object
vì vậy tôi đã hy vọng bất kỳ phương pháp Series nào sẽ hoạt động. Có ý kiến gì không?
apply
vàlambda
s. Tôi đến đây tự hỏi tại saopandas
thực sự nối và không trả về lỗi khi tính tổng các chuỗi.