Câu hỏi được gắn thẻ «feature-selection»

Phương pháp và nguyên tắc chọn tập hợp con các thuộc tính để sử dụng trong mô hình hóa tiếp theo


3
Một ví dụ: Hồi quy LASSO bằng glmnet cho kết quả nhị phân
Tôi bắt đầu say mê với việc sử dụng glmnetvới LASSO Regression trong đó kết quả quan tâm của tôi là phân đôi. Tôi đã tạo một khung dữ liệu giả nhỏ bên dưới: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

3
Lựa chọn tính năng và xác nhận chéo
Gần đây tôi đã đọc rất nhiều trên trang web này (@Aniko, @Dikran Marsupial, @Erik) và những nơi khác về vấn đề quá mức xảy ra với xác nhận chéo - (Smialowski et al 2010 Bioinformatics, Hastie, Các yếu tố của học thống kê). Gợi ý là mọi lựa chọn …





3
Các biến thường được điều chỉnh (ví dụ như được tiêu chuẩn hóa) trước khi tạo một mô hình - khi nào thì đây là một ý tưởng tốt và khi nào nó là một ý tưởng tồi?
Trong trường hợp nào bạn muốn, hoặc không muốn mở rộng hoặc chuẩn hóa một biến trước khi điều chỉnh mô hình? Và những lợi thế / bất lợi của việc nhân rộng một biến là gì?



3
Một rừng ngẫu nhiên có thể được sử dụng để lựa chọn tính năng trong hồi quy tuyến tính nhiều không?
Vì RF có thể xử lý phi tuyến tính nhưng không thể cung cấp các hệ số, nên sử dụng rừng ngẫu nhiên để thu thập các tính năng quan trọng nhất và sau đó cắm các tính năng đó vào mô hình hồi quy tuyến tính để có được …





Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.