Câu hỏi được gắn thẻ «data-mining»

Khai thác dữ liệu sử dụng các phương thức từ trí tuệ nhân tạo trong bối cảnh cơ sở dữ liệu để khám phá các mẫu chưa biết trước đó. Như vậy, các phương pháp thường không được giám sát. Nó liên quan chặt chẽ nhưng không giống với học máy. Nhiệm vụ chính của khai thác dữ liệu là phân tích cụm, phát hiện ngoại lệ và khai thác các quy tắc kết hợp.






3
Thuật toán Apriori bằng tiếng Anh?
Tôi đọc bài viết wiki về Apriori. Tôi gặp khó khăn trong việc hiểu các bước cắt tỉa và tham gia. Bất cứ ai có thể giải thích cho tôi làm thế nào thuật toán Apriori hoạt động bằng các thuật ngữ đơn giản (như Novice như tôi có thể …


2
Bắt đầu với việc đi xe đạp
Tôi đã thực hiện một số nghiên cứu trên internet về xe đạp. (Tôi đã đọc bài viết Wiki nhiều lần.) Cho đến nay, dường như có rất ít định nghĩa hoặc thuật ngữ tiêu chuẩn. Tôi đã tự hỏi nếu có bất kỳ giấy tờ hoặc sách tiêu chuẩn …

2
Tính toán đường cong ROC cho dữ liệu
Vì vậy, tôi có 16 thử nghiệm trong đó tôi đang cố gắng xác thực một người từ một đặc điểm sinh trắc học bằng cách sử dụng Hamming Khoảng cách. Ngưỡng của tôi được đặt thành 3,5. Dữ liệu của tôi ở bên dưới và chỉ có bản dùng …
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 

2
Random Forest có phải là một lựa chọn tốt để phân loại dữ liệu không cân bằng? [đóng cửa]
Đã đóng cửa . Câu hỏi này cần được tập trung hơn . Nó hiện không chấp nhận câu trả lời. Bạn muốn cải thiện câu hỏi này? Cập nhật câu hỏi để nó chỉ tập trung vào một vấn đề bằng cách chỉnh sửa bài đăng này . Đóng …






Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.