Câu hỏi được gắn thẻ «hierarchical-clustering»

Phân tích cụm phân cấp là một phương pháp phân tích cụm xây dựng, theo từng bước, một hệ thống phân cấp của các cụm, một biểu đồ. Phổ biến nhất là phân cụm phân cấp kết tụ (HAC) bắt đầu từ các đối tượng riêng lẻ và thu thập chúng thành các cụm ngày càng lớn hơn.

3
Làm thế nào để chọn một phương pháp phân cụm? Làm thế nào để xác nhận một giải pháp cụm (để đảm bảo sự lựa chọn phương pháp)?
Một trong những vấn đề lớn nhất với phân tích cụm là chúng ta có thể phải rút ra kết luận khác nhau khi dựa trên các phương pháp phân cụm khác nhau (bao gồm các phương pháp liên kết khác nhau trong phân cụm theo phân cấp). Tôi muốn …






4
Độ chính xác của máy tăng cường độ dốc giảm khi số lần lặp tăng
Tôi đang thử nghiệm thuật toán máy tăng cường độ dốc thông qua caretgói trong R. Sử dụng một bộ dữ liệu tuyển sinh đại học nhỏ, tôi đã chạy đoạn mã sau: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 


2
Có phải một khoảng cách phải là một số liệu của dòng Điên để một cụm phân cấp có giá trị trên đó không?
Hãy để chúng tôi nói rằng chúng tôi xác định một khoảng cách, không phải là một số liệu , giữa N mục. Dựa trên khoảng cách này, sau đó chúng tôi sử dụng phân cụm phân cấp kết tụ . Chúng ta có thể sử dụng từng thuật toán …


Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.