Cách tốt nhất để chuẩn bị các tương tác của các tính năng phân loại trước khi phù hợp với scikit-learn là gì?
Với statsmodels
tôi có thể thuận tiện nói theo kiểu R smf.ols(formula = 'depvar ~ C(var1)*C(var2)', data=df).fit()
(tương tự trong Stata với regress depvar i.var1##i.var2
).
Có thể sklearn.preprocessing.PolynomialFeatures
(trong v0.15, hiện tại dev) có thể được sử dụng với các biến phân loại không?
~var1*var2
hoàn toàn ổn trong R khi xây dựng ma trận RHS)