Câu hỏi được gắn thẻ «k-means»

k-mean là phương pháp phân vùng dữ liệu thành các cụm bằng cách tìm một số phương tiện xác định, k, st khi dữ liệu được gán cho các cụm với giá trị trung bình gần nhất, tổng bình phương của cụm w / i được thu nhỏ





8
Thực hiện phân cụm K-nghĩa (hoặc họ hàng gần của nó) chỉ với một ma trận khoảng cách, không phải dữ liệu theo điểm
Tôi muốn thực hiện phân cụm K-nghĩa trên các đối tượng tôi có, nhưng các đối tượng không được mô tả là các điểm trong không gian, tức là theo objects x featurestập dữ liệu. Tuy nhiên, tôi có thể tính khoảng cách giữa hai đối tượng bất kỳ (nó …

2
Nếu phân cụm k-nghĩa là một dạng mô hình hỗn hợp Gaussian, nó có thể được sử dụng khi dữ liệu không bình thường không?
Tôi đang đọc Giám mục về thuật toán EM cho GMM và mối quan hệ giữa GMM và k-mean. Trong cuốn sách này có nói rằng k-mean là phiên bản cứng của GMM. Tôi tự hỏi điều đó có nghĩa là nếu dữ liệu tôi đang cố gắng phân cụm …

4
Phân cụm một ma trận tương quan
Tôi có một ma trận tương quan trong đó nêu rõ mọi mặt hàng có tương quan với mặt hàng khác như thế nào. Do đó đối với một mục N, tôi đã có ma trận tương quan N * N. Sử dụng ma trận tương quan này, làm cách …

2
Bằng chứng về sự hội tụ của phương tiện k
Đối với một nhiệm vụ tôi đã được yêu cầu cung cấp một bằng chứng rằng k-mean hội tụ trong một số bước hữu hạn. Đây là những gì tôi đã viết: CCCE(C)=∑xmini=1k∥x−ci∥2E(C)=∑xmini=1k‖x−ci‖2E(C)=\sum_{\mathbf{x}}\min_{i=1}^{k}\left\Vert \mathbf{x}-\mathbf{c}_{i}\right\Vert ^{2}E(C)E(C)E(C) Bước 2 đề cập đến bước gắn nhãn từng điểm dữ liệu theo trung tâm …






4
Độ chính xác của máy tăng cường độ dốc giảm khi số lần lặp tăng
Tôi đang thử nghiệm thuật toán máy tăng cường độ dốc thông qua caretgói trong R. Sử dụng một bộ dữ liệu tuyển sinh đại học nhỏ, tôi đã chạy đoạn mã sau: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

1
Liệu lời nguyền Dimensionality có ảnh hưởng đến một số mô hình hơn những mô hình khác không?
Những nơi tôi đã đọc về lời nguyền chiều giải thích nó kết hợp với kNN là chủ yếu và các mô hình tuyến tính nói chung. Tôi thường xuyên thấy những người xếp hạng hàng đầu trong Kaggle sử dụng hàng ngàn tính năng trên bộ dữ liệu hầu …

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.