Tôi đang cố gắng hiểu chính xác các yếu tố hoạt động như thế nào trong R. Giả sử tôi muốn chạy hồi quy bằng một số dữ liệu mẫu trong R:
> data(CO2)
> colnames(CO2)
[1] "Plant"     "Type"      "Treatment" "conc"      "uptake"   
> levels(CO2$Type)
[1] "Quebec"      "Mississippi"
> levels(CO2$Treatment)
[1] "nonchilled" "chilled"   
> lm(uptake ~ Type + Treatment, data = CO2)
Call:
lm(formula = uptake ~ Type + Treatment, data = CO2)
Coefficients:
 (Intercept)   TypeMississippi  Treatmentchilled  
       36.97            -12.66             -6.86  
Tôi hiểu điều đó TypeMississippivà Treatmentchilledđược coi là booleans: Đối với mỗi hàng, sự hấp thu ban đầu là 36.97và chúng tôi trừ đi 12.66nếu đó là loại Mississippi và 6.86nếu nó được làm lạnh. Tôi đang gặp khó khăn để hiểu một cái gì đó như thế này:
 > lm(uptake ~ Type * Treatment, data = CO2)
 Call:
 lm(formula = uptake ~ Type * Treatment, data = CO2)
 Coefficients:
                 (Intercept)                   TypeMississippi  
                      35.333                            -9.381  
            Treatmentchilled  TypeMississippi:Treatmentchilled  
                      -3.581                            -6.557  
Có nghĩa là gì để nhân hai yếu tố với nhau trong một lm?