Tôi đã sử dụng RandomForest để phân loại 6 hành vi của động vật (ví dụ: Đứng, Đi bộ, Bơi, v.v.) dựa trên 8 biến số (tư thế và chuyển động cơ thể khác nhau).
MDSplot trong gói RandomForest cung cấp cho tôi đầu ra này và tôi gặp vấn đề trong việc diễn giải kết quả. Tôi đã thực hiện một PCA trên cùng một dữ liệu và có một sự tách biệt tốt giữa tất cả các lớp trong PC1 và PC2, nhưng ở đây Dim1 và Dim2 dường như chỉ tách biệt 3 hành vi. Điều này có nghĩa là ba hành vi này giống nhau hơn tất cả các hành vi khác (vì vậy MDS cố gắng tìm sự khác biệt lớn nhất giữa các biến, nhưng không nhất thiết là tất cả các biến trong bước đầu tiên)? Định vị của ba cụm (ví dụ như trong Dim1 và Dim2) chỉ ra điều gì? Vì tôi còn khá mới với RI cũng có vấn đề khi vẽ một huyền thoại cho cốt truyện này (tuy nhiên tôi có một ý tưởng về các màu sắc khác nhau có nghĩa là gì), nhưng có lẽ ai đó có thể giúp đỡ? Cảm ơn rất nhiều!!
Tôi thêm một cốt truyện được tạo bằng hàm ClassCenter trong RandomForest. Hàm này cũng sử dụng ma trận lân cận (giống như trong MDS Plot) để vẽ các nguyên mẫu. Nhưng chỉ cần nhìn vào các biểu dữ liệu cho sáu hành vi khác nhau, tôi không thể hiểu tại sao ma trận lân cận sẽ vẽ các nguyên mẫu của tôi như vậy. Tôi cũng đã thử chức năng classcenter với dữ liệu mống mắt và nó hoạt động. Nhưng có vẻ như nó không hoạt động cho dữ liệu của tôi ...
Đây là mã tôi đã sử dụng cho âm mưu này
be.rf <- randomForest(Behaviour~., data=be, prox=TRUE, importance=TRUE)
class1 <- classCenter(be[,-1], be[,1], be.rf$prox)
Protoplot <- plot(be[,4], be[,7], pch=21, xlab=names(be)[4], ylab=names(be)[7], bg=c("red", "green", "blue", "yellow", "turquoise", "orange") [as.numeric(factor(be$Behaviour))])
points(class1[,4], class1[,7], pch=21, cex=2, bg=c("red", "green", "blue", "yellow", "turquoise", "orange"))
Cột lớp của tôi là cột đầu tiên, theo sau là 8 dự đoán. Tôi đã vẽ hai trong số các biến dự đoán tốt nhất là x và y.