Câu hỏi được gắn thẻ «clustering»

Phân tích cụm là nhiệm vụ phân vùng dữ liệu thành các tập hợp con của các đối tượng theo "độ tương tự" lẫn nhau của chúng mà không sử dụng kiến ​​thức có sẵn như nhãn lớp. [Các cụm-tiêu chuẩn-lỗi và / hoặc các mẫu cụm phải được gắn thẻ như vậy; KHÔNG sử dụng thẻ "phân cụm" cho chúng.]





6
Phân cụm trên đầu ra của t-SNE
Tôi đã có một ứng dụng trong đó rất tiện để phân cụm một tập dữ liệu ồn ào trước khi tìm kiếm các hiệu ứng nhóm phụ trong các cụm. Lần đầu tiên tôi nhìn vào PCA, nhưng phải mất ~ 30 thành phần để có được 90% khả …

3
Một ví dụ: Hồi quy LASSO bằng glmnet cho kết quả nhị phân
Tôi bắt đầu say mê với việc sử dụng glmnetvới LASSO Regression trong đó kết quả quan tâm của tôi là phân đôi. Tôi đã tạo một khung dữ liệu giả nhỏ bên dưới: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

6
Chọn phương pháp phân cụm
Khi sử dụng phân tích cụm trên một tập dữ liệu để nhóm các trường hợp tương tự, người ta cần chọn trong số lượng lớn các phương pháp phân cụm và đo khoảng cách. Đôi khi, một lựa chọn có thể ảnh hưởng đến lựa chọn khác, nhưng có …



6
Cắt dendrogram ở đâu?
Phân cụm phân cấp có thể được biểu diễn bằng một dendrogram. Cắt một dendrogram ở một mức độ nhất định sẽ cho một tập hợp các cụm. Cắt ở cấp độ khác cho một cụm khác. Làm thế nào bạn sẽ chọn nơi để cắt dendrogram? Có một cái …

5
Mối quan hệ giữa phân cụm k-nghĩa và PCA là gì?
Đó là một thực tế phổ biến để áp dụng PCA (phân tích thành phần chính) trước một thuật toán phân cụm (chẳng hạn như phương tiện k). Người ta tin rằng nó cải thiện kết quả phân cụm trong thực tế (giảm nhiễu). Tuy nhiên, tôi quan tâm đến …

10
Làm thế nào để quyết định số cụm chính xác?
Chúng tôi tìm thấy các trung tâm cụm và gán điểm cho k thùng khác nhau trong cụm k-nghĩa là thuật toán rất nổi tiếng và được tìm thấy gần như trong mọi gói học máy trên mạng. Nhưng phần còn thiếu và quan trọng nhất theo ý kiến ​​của …

10
Phân cụm với một ma trận khoảng cách
Tôi có một ma trận (đối xứng) Mđại diện cho khoảng cách giữa mỗi cặp nút. Ví dụ, ABCDEFGHIJKL A 0 20 20 20 40 60 60 60 100 120 120 120 B 20 0 20 20 60 80 80 80 120 140 140 140 C 20 20 0 20 …
52 clustering 

2
Làm thế nào một mạng thần kinh nhân tạo ANN, có thể được sử dụng để phân cụm không giám sát?
Tôi hiểu làm thế nào một artificial neural network (ANN), có thể được đào tạo một cách có giám sát bằng cách sử dụng backpropogation để cải thiện sự phù hợp bằng cách giảm lỗi trong các dự đoán. Tôi đã nghe nói rằng ANN có thể được sử dụng …


Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.