Cách tốt nhất để chuẩn bị các tương tác của các tính năng phân loại trước khi phù hợp với scikit-learn là gì?
Với statsmodelstôi có thể thuận tiện nói theo kiểu R smf.ols(formula = 'depvar ~ C(var1)*C(var2)', data=df).fit()(tương tự trong Stata với regress depvar i.var1##i.var2).
Có thể sklearn.preprocessing.PolynomialFeatures(trong v0.15, hiện tại dev) có thể được sử dụng với các biến phân loại không?
~var1*var2hoàn toàn ổn trong R khi xây dựng ma trận RHS)