Tôi đang làm việc với mã rừng ngẫu nhiên của Breiman ( http: //stat-www.ber siêu.edu/users/oustiman/RandomForests/cc_manual.htmlm#c2 ) để phân loại dữ liệu vệ tinh (học có giám sát). Tôi đang sử dụng tập dữ liệu huấn luyện và kiểm tra có cỡ mẫu 2000 và kích thước thay đổi 10. Dữ liệu được phân loại thành hai lớp A và B. Trong chế độ học có giám sát, thuật toán hoạt động tốt với sai số phân loại rất thấp (<2%) . Bây giờ tôi muốn thử phân loại không giám sát mà không có nhãn lớp trong tập dữ liệu thử nghiệm và xem thuật toán có thể dự đoán các lớp như thế nào. Có cách nào để thực hiện phân loại không giám sát bằng mã của Breiman không? Liệu lỗi từ phương pháp này sẽ cao hơn phân loại có giám sát? Dữ liệu và cài đặt tham số chạy trong thuật toán được đưa ra dưới đây
MÔ TẢ DỮ LIỆU 1 mdim = 10, ntrain = 2000, n class = 2, maxcat = 1, 1 ntest = 2000, nhãnts = 1, labeltr = 1,
THIẾT LẬP PARAMETERS 2 mtry0 = 3, ndsize = 1, jbt = 500, look = 100, lookcls = 1, 2 jgroupwt = 0, mdim2nd = 0, mselect = 0,