Phân tích cụm tiếp theo là Phân tích phân biệt đối xử

Lý do nào, nếu có, để sử dụng Phân tích phân biệt (DA) trên các kết quả của thuật toán phân cụm như k-mean, theo thời gian tôi thấy nó trong tài liệu (về cơ bản là phân nhóm lâm sàng các rối loạn tâm thần)?

Nhìn chung, không nên kiểm tra sự khác biệt của nhóm đối với các biến được sử dụng trong quá trình xây dựng cụm vì chúng hỗ trợ tối đa hóa (tối thiểu hóa) của quán tính giữa các lớp (tương ứng trong lớp). Vì vậy, tôi không chắc chắn đánh giá đầy đủ giá trị gia tăng của DA dự đoán, trừ khi chúng tôi tìm cách nhúng các cá nhân vào không gian giai đoạn thấp hơn và có ý tưởng về "tính tổng quát" của phân vùng như vậy. Nhưng ngay cả trong trường hợp này, phân tích cụm về cơ bản vẫn là một công cụ thăm dò, vì vậy sử dụng tư cách thành viên lớp được tính theo cách này để tiếp tục rút ra một quy tắc tính điểm có vẻ lạ ngay từ cái nhìn đầu tiên.

Bất kỳ khuyến nghị, ý tưởng hoặc con trỏ đến các giấy tờ có liên quan?

clustering discriminant-analysis

— chl
nguồn

Đây là một lời giải thích và ví dụ sử dụng R: cran.r-project.org/web/packages/adegenet/vignettes/ Kẻ

— Ben

Tôi không biết bất kỳ giấy tờ về điều này. Tôi đã sử dụng phương pháp này, cho mục đích mô tả. DFA cung cấp một cách hay để tóm tắt sự khác biệt và chiều của nhóm đối với các biến ban đầu. Người ta có thể dễ dàng hơn chỉ hồ sơ các nhóm trên các biến ban đầu, tuy nhiên, điều này làm mất đi tính chất đa biến vốn có của vấn đề phân cụm. DFA cho phép bạn mô tả các nhóm trong khi vẫn giữ nguyên tính đa biến của vấn đề. Vì vậy, nó có thể hỗ trợ việc giải thích các cụm, trong đó đó là một mục tiêu. Điều này đặc biệt lý tưởng khi có mối quan hệ chặt chẽ giữa phương pháp phân cụm và phương pháp phân loại của bạn - ví dụ: phương pháp của DFA và Ward.

Bạn đã đúng về vấn đề kiểm tra. Tôi đã xuất bản một bài báo sử dụng Phân tích cụm với theo dõi DFA để mô tả giải pháp phân cụm. Tôi đã trình bày kết quả DFA không có số liệu thống kê kiểm tra. Một nhà phê bình đã đưa ra vấn đề với điều đó. Tôi thừa nhận và đưa số liệu thống kê kiểm tra và giá trị p vào đó, với tuyên bố từ chối trách nhiệm rằng các giá trị p này không nên được diễn giải theo cách truyền thống.

— Brett
nguồn

Điều gì sẽ là các bước thủ tục của DA sau khi phân cụm? Bạn có thể nghĩ về các kỹ thuật khác để tìm ra các biến ban đầu làm cho cụm nhất định khác với các biến khác không?

— dana.zuokas

Muốn chia sẻ trích dẫn vào bài báo đó, Brett?

— Roman Luštrik

Weissman & Magill. 2008 "Phát triển một loại hình sinh viên để kiểm tra hiệu quả của các hội thảo năm đầu tiên" Tạp chí về kinh nghiệm và sinh viên năm thứ nhất trong quá trình chuyển đổi 20 (2). Liên hệ với tôi ngoại tuyến nếu bạn muốn một bản sao cứng.

— Brett