Lý do nào, nếu có, để sử dụng Phân tích phân biệt (DA) trên các kết quả của thuật toán phân cụm như k-mean, theo thời gian tôi thấy nó trong tài liệu (về cơ bản là phân nhóm lâm sàng các rối loạn tâm thần)?
Nhìn chung, không nên kiểm tra sự khác biệt của nhóm đối với các biến được sử dụng trong quá trình xây dựng cụm vì chúng hỗ trợ tối đa hóa (tối thiểu hóa) của quán tính giữa các lớp (tương ứng trong lớp). Vì vậy, tôi không chắc chắn đánh giá đầy đủ giá trị gia tăng của DA dự đoán, trừ khi chúng tôi tìm cách nhúng các cá nhân vào không gian giai đoạn thấp hơn và có ý tưởng về "tính tổng quát" của phân vùng như vậy. Nhưng ngay cả trong trường hợp này, phân tích cụm về cơ bản vẫn là một công cụ thăm dò, vì vậy sử dụng tư cách thành viên lớp được tính theo cách này để tiếp tục rút ra một quy tắc tính điểm có vẻ lạ ngay từ cái nhìn đầu tiên.
Bất kỳ khuyến nghị, ý tưởng hoặc con trỏ đến các giấy tờ có liên quan?
R
: cran.r-project.org/web/packages/adegenet/vignettes/ Kẻ