Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu


3
Ví dụ về lỗi trong thuật toán MCMC
Tôi đang nghiên cứu một phương pháp để tự động kiểm tra các phương pháp Monte Carlo chuỗi Markov và tôi muốn một số ví dụ về các lỗi có thể xảy ra khi xây dựng hoặc thực hiện các thuật toán đó. Điểm thưởng nếu phương pháp không chính …
28 mcmc 

4
Các biện pháp tương tự hoặc khoảng cách giữa hai ma trận hiệp phương sai
Có bất kỳ thước đo tương tự hoặc khoảng cách giữa hai ma trận hiệp phương sai đối xứng (cả hai đều có cùng kích thước) không? Tôi đang suy nghĩ ở đây về sự tương tự với phân kỳ KL của hai phân phối xác suất hoặc khoảng cách …



1
Điều gì đằng sau API dự đoán của Google?
API dự đoán của Google là một dịch vụ đám mây nơi người dùng có thể gửi một số dữ liệu đào tạo để huấn luyện một số phân loại bí ẩn và sau đó yêu cầu nó phân loại dữ liệu đến, ví dụ để triển khai các bộ …


1
Tính toán độ lặp lại của hiệu ứng từ mô hình lmer
Tôi vừa xem qua bài viết này , trong đó mô tả cách tính toán độ lặp lại (còn gọi là độ tin cậy, hay còn gọi là tương quan nội hàm) của phép đo thông qua mô hình hiệu ứng hỗn hợp. Mã R sẽ là: #fit the model …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 




4
Công thức bình phương giả cho GLM
Tôi tìm thấy một công thức cho giả trong cuốn sách Mở rộng mô hình tuyến tính với R, Julian J. Faraway (trang 59).R2R2R^2 1−ResidualDevianceNullDeviance1−ResidualDevianceNullDeviance1-\frac{\text{ResidualDeviance}}{\text{NullDeviance}} . Đây có phải là một công thức phổ biến cho giả cho GLM không?R2R2R^2

6
Các vấn đề với biểu đồ tròn
Dường như có sự thảo luận ngày càng tăng về biểu đồ tròn. Các đối số chính chống lại nó dường như là: Diện tích được cảm nhận với sức mạnh ít hơn chiều dài. Biểu đồ hình tròn có tỷ lệ điểm-điểm-dữ liệu rất thấp Tuy nhiên, tôi nghĩ …

3
Bắt seRious về chuỗi thời gian với R
Nếu bạn nghĩ lại, khi bạn bắt đầu với phân tích chuỗi thời gian. Những công cụ, gói R và tài nguyên internet nào bạn muốn bạn biết về? Điều tôi đang cố hỏi là, nên bắt đầu từ đâu? Cụ thể, có bất kỳ tài nguyên nào cho R …
28 r  time-series 


Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.