Nếu tôi có một bảng như thế này:
df = pd.DataFrame({
'hID': [101, 102, 103, 101, 102, 104, 105, 101],
'dID': [10, 11, 12, 10, 11, 10, 12, 10],
'uID': ['James', 'Henry', 'Abe', 'James', 'Henry', 'Brian', 'Claude', 'James'],
'mID': ['A', 'B', 'A', 'B', 'A', 'A', 'A', 'C']
})
Tôi có thể làm count(distinct hID)
trong Qlik để đưa ra số đếm là 5 cho hID duy nhất. Làm cách nào để thực hiện điều đó trong python bằng khung dữ liệu gấu trúc? Hoặc có thể là một mảng numpy? Tương tự, nếu phải làm, count(hID)
tôi sẽ nhận được 8 trong Qlik. Cách tương đương để làm điều đó ở gấu trúc là gì?