Tôi muốn lọc các hàng theo một hàm của mỗi hàng, ví dụ:
def f(row):
return sin(row['velocity'])/np.prod(['masses']) > 5
df = pandas.DataFrame(...)
filtered = df[apply_to_all_rows(df, f)]
Hoặc đối với một ví dụ khác phức tạp hơn,
def g(row):
if row['col1'].method1() == 1:
val = row['col1'].method2() / row['col1'].method3(row['col3'], row['col4'])
else:
val = row['col2'].method5(row['col6'])
return np.sin(val)
df = pandas.DataFrame(...)
filtered = df[apply_to_all_rows(df, g)]
Làm thế nào tôi có thể làm như vậy?
apply
trong tình huống này. Chỉ mục boolean thông thường sẽ hoạt động tốt.df[df['b] > df['c']]
. Có rất ít tình huống thật sự yêu cầuapply
và thậm chí vài cần nó vớiaxis=1