Các pandas
drop_duplicates
chức năng là rất tốt cho "uniquifying" một dataframe. Tuy nhiên, một trong những đối số từ khóa cần chuyển là take_last=True
hoặc take_last=False
, trong khi tôi muốn bỏ tất cả các hàng trùng lặp trên một tập hợp con của các cột. Điều này có thể không?
A B C
0 foo 0 A
1 foo 1 A
2 foo 1 B
3 bar 1 A
Ví dụ, tôi muốn thả các hàng khớp với các cột A
và C
vì vậy điều này sẽ thả các hàng 0 và 1.