Giả sử, có một số foo_data_frame data.frame và người ta muốn tìm hồi quy của cột mục tiêu Y theo một số cột khác. Vì mục đích đó, một số công thức và mô hình thường được sử dụng. Ví dụ:
linear_model <- lm(Y ~ FACTOR_NAME_1 + FACTOR_NAME_2, foo_data_frame)
Điều đó hoạt động tốt nếu công thức được mã hóa tĩnh. Nếu muốn root trên một số mô hình với số lượng biến phụ thuộc không đổi (giả sử, 2) thì nó có thể được xử lý như vậy:
for (i in seq_len(factor_number)) {
for (j in seq(i + 1, factor_number)) {
linear_model <- lm(Y ~ F1 + F2, list(Y=foo_data_frame$Y,
F1=foo_data_frame[[i]],
F2=foo_data_frame[[j]]))
# linear_model further analyzing...
}
}
Câu hỏi của tôi là làm thế nào để làm điều tương tự ảnh hưởng khi số lượng biến đang thay đổi động trong quá trình chạy chương trình?
for (number_of_factors in seq_len(5)) {
# Then root over subsets with #number_of_factors cardinality.
for (factors_subset in all_subsets_with_fixed_cardinality) {
# Here I want to fit model with factors from factors_subset.
linear_model <- lm(Does R provide smth to write here?)
}
}