Câu hỏi được gắn thẻ «clustering»

Phân tích cụm là nhiệm vụ phân vùng dữ liệu thành các tập hợp con của các đối tượng theo "độ tương tự" lẫn nhau của chúng mà không sử dụng kiến ​​thức có sẵn như nhãn lớp. [Các cụm-tiêu chuẩn-lỗi và / hoặc các mẫu cụm phải được gắn thẻ như vậy; KHÔNG sử dụng thẻ "phân cụm" cho chúng.]

3
Bạn có thể sử dụng khoảng cách Manhattan với liên kết giữa các cụm của Ward trong phân cụm theo cấp bậc không?
Tôi đang sử dụng phân cụm theo phân cấp để phân tích dữ liệu chuỗi thời gian. Mã của tôi được triển khai bằng hàm MathicalaDirectAgglomerate[...] , tạo ra các cụm phân cấp cho các đầu vào sau: một ma trận khoảng cách D tên của phương thức được sử …


1
Làm thế nào để tính toán độ tinh khiết?
Trong phân tích cụm làm thế nào để chúng ta tính toán độ tinh khiết? Phương trình là gì? Tôi không tìm kiếm một mã để làm điều đó cho tôi. Đặt là cụm k và c j là lớp j.ωkωk\omega_kcjcjc_j Vì vậy, độ tinh khiết thực tế chính xác? …
15 clustering 


1
Phương pháp so sánh nào được sử dụng cho mô hình lmer: lsmeans hoặc glht?
Tôi đang phân tích một tập dữ liệu bằng mô hình hiệu ứng hỗn hợp với một hiệu ứng cố định (điều kiện) và hai hiệu ứng ngẫu nhiên (người tham gia do thiết kế chủ đề và cặp bên trong). Mô hình được tạo ra với lme4gói : exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp). …


2
k-nghĩa vs k-trung?
Tôi biết có thuật toán phân cụm k-mean và k-median. Một cái sử dụng giá trị trung bình là trung tâm của cụm và cái còn lại sử dụng trung vị. Câu hỏi của tôi là: khi nào / sử dụng ở đâu?




3
Ai đó có thể vui lòng giải thích cong vênh thời gian động để xác định độ tương tự chuỗi thời gian không?
Tôi đang cố gắng nắm bắt các biện pháp cong vênh thời gian động để so sánh chuỗi thời gian với nhau. Tôi có ba bộ dữ liệu chuỗi thời gian như thế này: T1 <- structure(c(0.000213652387565, 0.000535045478866, 0, 0, 0.000219346347883, 0.000359669104424, 0.000269469145783, 0.00016051364366, 0.000181950509461, 0.000385579332948, 0.00078170803205, 0.000747244535774, 0, 0.000622858922454, …


3
hoặc
Có ai sử dụng số liệu hoặc L .5 để phân cụm, thay vì L 2 không? Aggarwal và cộng sự, về hành vi đáng ngạc nhiên của các số liệu khoảng cách trong không gian chiều cao cho biết (năm 2001) rằngL1L1L_1L.5L.5L_.5L2L2L_2 luôn được ưu tiên hơn so với …



Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.