Tôi đang sử dụng gấu trúc làm công cụ thay thế db vì tôi có nhiều cơ sở dữ liệu (oracle, mssql, v.v.) và tôi không thể tạo một chuỗi các lệnh thành tương đương SQL.
Tôi có một bảng được tải trong DataFrame với một số cột:
YEARMONTH, CLIENTCODE, SIZE, .... etc etc
Trong SQL, để đếm số lượng khách hàng khác nhau mỗi năm sẽ là:
SELECT count(distinct CLIENTCODE) FROM table GROUP BY YEARMONTH;
Và kết quả sẽ là
201301 5000
201302 13245
Làm thế nào tôi có thể làm điều đó trong gấu trúc?
value_counts
có thể là câu trả lời mà bạn đang tìm kiếm: pandas.pydata.org/pandas-docs/urdy/generated/ Kẻ