Câu hỏi được gắn thẻ «categorical-data»

Dữ liệu phân loại (còn gọi là danh nghĩa) có thể đảm nhận một số lượng hạn chế các giá trị có thể được gọi là danh mục. Giá trị phân loại "nhãn", chúng không "đo lường". Vui lòng sử dụng thẻ [ordinal-data] cho các loại dữ liệu rời rạc nhưng được sắp xếp.

6
Phân tích thành phần chính có thể được áp dụng cho các bộ dữ liệu có chứa hỗn hợp các biến liên tục và phân loại không?
Tôi có một bộ dữ liệu có cả dữ liệu liên tục và phân loại. Tôi đang phân tích bằng cách sử dụng PCA và tự hỏi liệu có tốt không nếu bao gồm các biến phân loại như là một phần của phân tích. Hiểu biết của tôi là …



3
Một ví dụ: Hồi quy LASSO bằng glmnet cho kết quả nhị phân
Tôi bắt đầu say mê với việc sử dụng glmnetvới LASSO Regression trong đó kết quả quan tâm của tôi là phân đôi. Tôi đã tạo một khung dữ liệu giả nhỏ bên dưới: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

6
Nguyên tắc cách thu gọn các biến phân loại với nhiều cấp độ?
Những kỹ thuật nào có sẵn để thu gọn (hoặc gộp) nhiều loại thành một số ít, với mục đích sử dụng chúng làm đầu vào (dự đoán) trong mô hình thống kê? Hãy xem xét một biến như chuyên ngành sinh viên đại học (ngành học được chọn bởi …





5
Mối tương quan giữa các biến liên tục và phân loại (danh nghĩa)
Tôi muốn tìm mối tương quan giữa một biến liên tục (biến phụ thuộc) và biến phân loại (danh nghĩa: giới tính, biến độc lập). Dữ liệu liên tục thường không được phân phối. Trước đây, tôi đã tính toán nó bằng cách sử dụng Spearman . Tuy nhiên, tôi …




3

5
Cách xử lý dữ liệu phân cấp / lồng nhau trong học máy
Tôi sẽ giải thích vấn đề của tôi bằng một ví dụ. Giả sử bạn muốn dự đoán thu nhập của một cá nhân được cung cấp một số thuộc tính: {Tuổi, Giới tính, Quốc gia, Vùng, Thành phố}. Bạn có một tập dữ liệu đào tạo như vậy train …
29 regression  machine-learning  multilevel-analysis  correlation  dataset  spatial  paired-comparisons  cross-correlation  clustering  aic  bic  dependent-variable  k-means  mean  standard-error  measurement-error  errors-in-variables  regression  multiple-regression  pca  linear-model  dimensionality-reduction  machine-learning  neural-networks  deep-learning  conv-neural-network  computer-vision  clustering  spss  r  weighted-data  wilcoxon-signed-rank  bayesian  hierarchical-bayesian  bugs  stan  distributions  categorical-data  variance  ecology  r  survival  regression  r-squared  descriptive-statistics  cross-section  maximum-likelihood  factor-analysis  likert  r  multiple-imputation  propensity-scores  distributions  t-test  logit  probit  z-test  confidence-interval  poisson-distribution  deep-learning  conv-neural-network  residual-networks  r  survey  wilcoxon-mann-whitney  ranking  kruskal-wallis  bias  loss-functions  frequentist  decision-theory  risk  machine-learning  distributions  normal-distribution  multivariate-analysis  inference  dataset  factor-analysis  survey  multilevel-analysis  clinical-trials 

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.