Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu



1
Tại sao Anova () và drop1 () cung cấp các câu trả lời khác nhau cho GLMM?
Tôi có một GLMM có dạng: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Khi tôi sử dụng drop1(model, test="Chi"), tôi nhận được kết quả khác với nếu tôi sử dụng Anova(model, type="III")từ gói xe hơi hoặc summary(model). Hai cái sau cho cùng một …
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

2
Làm cách nào để tạo số theo phân phối Soliton?
Các phân phối soliton là một phân phối xác suất rời rạc trên một tập với chức năng xác xuất hàng loạt{1,…,N}{1,…,N}\{1,\dots, N\} p(1)=1N,p(k)=1k(k−1)for k∈{2,…,N}p(1)=1N,p(k)=1k(k−1)for k∈{2,…,N} p(1)=\frac{1}{N},\qquad p(k)=\frac{1}{k(k-1)}\quad\text{for }k\in\{2,\dots, N\} Tôi muốn sử dụng nó như là một phần của việc triển khai mã LT , lý tưởng nhất là …



2
Nhầm lẫn về khoảng tin cậy
Tôi bối rối về khái niệm khoảng tin cậy. Cụ thể, giả sử có biến Gaussian với biết và tôi quan tâm đến giới hạn dưới của giá trị trung bình với độ tin cậy .X∼N(μ,σ)X∼N(μ,σ)X \sim N(\mu, \sigma)σσ\sigmaμLμL\mu_L95%95%95\% Tôi sẽ thực hiện thử nghiệm trong lần và quan sát …

1
Bayes yếu tố với linh mục không đúng
Tôi có một câu hỏi liên quan đến so sánh mô hình bằng cách sử dụng các yếu tố Bayes. Trong nhiều trường hợp, các nhà thống kê quan tâm đến việc sử dụng phương pháp Bayes với các linh mục không phù hợp (ví dụ như một số linh …

2
Xấp xỉ đơn giản của phân phối tích lũy Poisson ở đuôi dài?
Tôi muốn quyết định dung lượng của một bảng để nó có tỷ lệ cược dư nhỏ hơn để tràn cho , giả sử số lượng mục nhập theo luật Poisson với một giá trị đã cho kỳ vọng .CCC2−p2−p2^{-p}p∈[40…120]p∈[40…120]p\in[40\dots 120]E∈[103…1012]E∈[103…1012]E\in[10^3\dots 10^{12}] Lý tưởng nhất, tôi muốn số nguyên thấp …



1
RandomForest và lỗi quan trọng thay đổi?
Tôi không nhận được sự khác biệt giữa rfobject$importancevà importance(rfobject)trong cột MeanDecreasAccuracy. Thí dụ: > data("iris") > fit <- randomForest(Species~., data=iris, importance=TRUE) > fit$importance setosa versicolor virginica MeanDecreaseAccuracy MeanDecreaseGini Sepal.Length 0.027078501 0.019418330 0.040497602 0.02898837 9.173648 Sepal.Width 0.008553449 0.001962036 0.006951771 0.00575489 2.472105 Petal.Length 0.313303381 0.291818815 0.280981959 0.29216790 41.284869 Petal.Width 0.349686983 0.318527008 …




Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.