Câu hỏi được gắn thẻ «resampling»

Lấy mẫu lại là lấy một mẫu từ một mẫu. Việc sử dụng phổ biến là jackknifing (lấy mẫu phụ, ví dụ: tất cả các giá trị trừ 1) & bootstrapping (lấy mẫu w / thay thế). Những kỹ thuật này có thể cung cấp một ước tính mạnh mẽ về phân phối lấy mẫu khi khó có thể hoặc không thể lấy được phân tích.




1
Hệ số Gini và giới hạn lỗi
Tôi có một chuỗi thời gian dữ liệu với số lượng N = 14 tại mỗi thời điểm và tôi muốn tính hệ số Gini và một lỗi tiêu chuẩn cho ước tính này tại mỗi thời điểm. Vì tôi chỉ có N = 14 đếm tại mỗi thời điểm …

4
Tại sao các bài kiểm tra giả thuyết trên các bộ dữ liệu được lấy mẫu lại từ chối null quá thường xuyên?
tl; dr: Bắt đầu với một tập dữ liệu được tạo dưới dạng null, tôi đã ghép lại các trường hợp với sự thay thế và tiến hành kiểm tra giả thuyết trên mỗi tập dữ liệu được lấy mẫu lại. Các thử nghiệm giả thuyết này từ chối null …

2
Văn bản tốt cho việc lấy lại mẫu?
Nhóm có thể đề xuất một văn bản / tài nguyên giới thiệu tốt cho các kỹ thuật lấy mẫu lại được áp dụng không? Cụ thể, tôi quan tâm đến các lựa chọn thay thế cho các thử nghiệm tham số cổ điển (ví dụ: các thử nghiệm t, …


1
Mô hình học sâu nào có thể phân loại các danh mục không loại trừ lẫn nhau
Ví dụ: Tôi có một câu trong mô tả công việc: "Kỹ sư cao cấp Java ở Anh". Tôi muốn sử dụng một mô hình học tập sâu để dự đoán nó thành 2 loại: English và IT jobs. Nếu tôi sử dụng mô hình phân loại truyền thống, nó …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

2
Kích thước của mẫu bootstrap
Tôi đang tìm hiểu về bootstrapping như một phương tiện để ước tính phương sai của thống kê mẫu. Tôi có một nghi ngờ cơ bản. Trích dẫn từ http://web.stanford.edu/group/psych252/tutorials/doBootstrapPrimer.pdf : • Có bao nhiêu quan sát chúng ta nên lấy mẫu lại? Một gợi ý tốt là kích thước …

1
Quá khổ với các biến phân loại
Tôi muốn thực hiện kết hợp quá khổ và lấy mẫu thấp để cân bằng tập dữ liệu của mình với khoảng 4000 khách hàng được chia thành hai nhóm, trong đó một trong các nhóm có tỷ lệ khoảng 15%. Tôi đã xem xét SMOTE ( http://www.inside-r.org/packages/cran/DMwR/docs/SMOTE ) và …

1
Có thể sử dụng phương pháp lấy mẫu bootstrap để tính khoảng tin cậy cho phương sai của tập dữ liệu không?
Tôi biết rằng nếu bạn lấy mẫu lại từ một tập dữ liệu nhiều lần và tính giá trị trung bình mỗi lần, các phương tiện này sẽ tuân theo phân phối bình thường (theo CLT). Do đó, bạn có thể tính khoảng tin cậy trên giá trị trung bình …




Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.