Cách tốt nhất để phân cụm một ma trận kề


8

Tôi đã có một thời gian khó khăn để giải thích các cụm kết quả của một ma trận kề. Tôi có 200 ma trận tương đối lớn đại diện cho các đối tượng có chứa tương quan một phần (điểm z) của chuỗi thời gian (dữ liệu thần kinh). Mục tiêu là phân cụm 210 ma trận đó và phát hiện bất kỳ cộng đồng chưa được khám phá tiềm năng nào. Vì vậy, tôi đã thực hiện một phép tính tương quan một phần khác dẫn đến ma trận kề 200x200. Bất cứ khi nào tôi chạy một thuật toán phát hiện cộng đồng (ví dụ như Newmann), nó sẽ xuất hiện với các cộng đồng khó hiểu.

Câu hỏi đặt ra là loại kiểm tra thống kê nào sẽ cho biết các cộng đồng hoặc cụm này có ý nghĩa gì không? và nếu vậy, có những cách có hệ thống để giải thích?


Theo như tôi biết thì không có "cách đúng" duy nhất để làm điều này. Một cách tiếp cận sẽ là sử dụng một cái gì đó như phân cụm theo thứ bậc trên ma trận khoảng cáchtrong đó là mối tương quan. Điều khác là liệu ma trận tương quan sau này của bạn sẽ nắm bắt các mối quan hệ có ý nghĩa. Những bước đã được thực hiện để sản xuất nó? ρ1-|ρ|ρ
phỏng đoán

Cảm ơn. Về câu hỏi của bạn, điều tôi đã làm là tôi tương quan mọi hàng (hoặc dữ liệu của chủ đề) với mọi chủ đề khác bằng cách sử dụng Corrcoef (tương quan đơn giản) và đó là cách tôi có kết quả. Tôi đang cố gắng phát hiện các mẫu và đó là lý do tại sao tôi phải tương quan lại.
Fahd

trong OP, đề xuất rằng dữ liệu chủ đề là ma trận có giá trị, vậy làm thế nào để nó trở thành một hàng duy nhất cho mỗi đối tượng?
phỏng đoán

Câu trả lời:


2

Tôi đã thực hiện một số công việc trong quá khứ về phân cụm phổ có thể được sử dụng ở đây. Ý tưởng cơ bản là người ta có thể sử dụng ma trận kề để tạo thành ma trận Laplacian:

L= =Tôi-D-1/2MộtD-1/2

(B1,B2)


2

Tôi đang xem xét cùng một vấn đề tại thời điểm này. Từ đánh giá nhanh, có vẻ như phân cụm Spectral là cách "tự nhiên" nhất để phân tích ma trận điều chỉnh. Xem bài đăng trên blog này để biết thêm chi tiết.


0

Ngoài ra ... Dữ liệu thần kinh (thực hoặc nhân tạo) thường là biểu diễn dữ liệu được nén rất cao, có nghĩa là dữ liệu rất ngẫu nhiên, có nghĩa là bạn sẽ không tìm thấy bất kỳ mối tương quan nào. Mà bạn có !! Xin chúc mừng! :)

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.