Tôi đang tìm cách làm tương đương với SQL
SELECT DISTINCT col1, col2 FROM dataframe_table
So sánh pandas sql không có bất cứ điều gì về distinct
.
.unique()
chỉ hoạt động cho một cột duy nhất, vì vậy tôi cho rằng tôi có thể nối các cột hoặc đặt chúng vào một danh sách / tuple và so sánh theo cách đó, nhưng điều này có vẻ như điều gì đó gấu trúc nên làm theo cách nguyên bản hơn.
Tôi đang thiếu một cái gì đó rõ ràng, hay là không có cách nào để làm điều này?
df.apply(pd.Series.unique)
nhưng điều này sẽ không hoạt động nếu số lượng giá trị duy nhất khác nhau trên các cột, vì vậy bạn phải tạo một chính tả của tên cột làm khóa và giá trị duy nhất làm giá trị