Câu hỏi được gắn thẻ «data-imputation»

Đề cập đến một lớp chung các phương thức được sử dụng để "điền" dữ liệu bị thiếu. Các phương thức được sử dụng để thực hiện việc này thường liên quan đến phép nội suy (http://en.wikipedia.org/wiki/Interpolation) và yêu cầu các giả định về lý do tại sao dữ liệu bị thiếu (ví dụ: "mất ngẫu nhiên")









3
Cách thực hiện SVD để áp đặt các giá trị bị thiếu, một ví dụ cụ thể
Tôi đã đọc những bình luận tuyệt vời về cách xử lý các giá trị bị thiếu trước khi áp dụng SVD, nhưng tôi muốn biết nó hoạt động như thế nào với một ví dụ đơn giản: Movie1 Movie2 Movie3 User1 5 4 User2 2 5 5 User3 3 …
8 r  missing-data  data-imputation  svd  sampling  matlab  mcmc  importance-sampling  predictive-models  prediction  algorithms  graphical-model  graph-theory  r  regression  regression-coefficients  r-squared  r  regression  modeling  confounding  residuals  fitting  glmm  zero-inflation  overdispersion  optimization  curve-fitting  regression  time-series  order-statistics  bayesian  prior  uninformative-prior  probability  discrete-data  kolmogorov-smirnov  r  data-visualization  histogram  dimensionality-reduction  classification  clustering  accuracy  semi-supervised  labeling  state-space-models  t-test  biostatistics  paired-comparisons  paired-data  bioinformatics  regression  logistic  multiple-regression  mixed-model  random-effects-model  neural-networks  error-propagation  numerical-integration  time-series  missing-data  data-imputation  probability  self-study  combinatorics  survival  cox-model  statistical-significance  wilcoxon-mann-whitney  hypothesis-testing  distributions  normal-distribution  variance  t-distribution  probability  simulation  random-walk  diffusion  hypothesis-testing  z-test  hypothesis-testing  data-transformation  lognormal  r  regression  agreement-statistics  classification  svm  mixed-model  non-independent  observational-study  goodness-of-fit  residuals  confirmatory-factor  neural-networks  deep-learning 




2
Tỷ lệ thiếu và nhiều lần cắt cụt
Có giới hạn nào ít được chấp nhận nhất khi sử dụng nhiều lần cắt ngang (MI) không? Ví dụ: tôi có thể sử dụng MI nếu các giá trị bị thiếu trong một biến là 20% các trường hợp trong khi và các biến khác có các giá trị …

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.