RandomForest chọn hồi quy thay vì phân loại

12

Tôi đang sử dụng gói RandomForest trong R và sử dụng dữ liệu mống mắt, rừng ngẫu nhiên được tạo là một phân loại nhưng khi tôi sử dụng bộ dữ liệu với khoảng 700 tính năng (các tính năng là mỗi pixel trong hình ảnh 28x28 pixel) và cột nhãn được đặt tên label, randomForestđược tạo ra là hồi quy. Tôi đang sử dụng dòng sau:

rf <- randomForest(label ~ ., data=train)

Làm thế nào đến hồi quy được sử dụng thay vì phân loại? Dữ liệu được đọc qua read.csv().

r random-forest

— Bỏ học trung học
nguồn

10

RandomForest sẽ mặc định để phân loại hoặc hồi quy tùy thuộc vào lớp của biến. Vì vậy, nếu bạn gõ

class(iris$Species)

bạn sẽ thấy đó là một yếu tố 'nhãn' trong mã của bạn, rất có thể là số, do đó, RandomForest mặc định là hồi quy. Bạn sẽ cần phải chuyển đổi nó thành một yếu tố để phân loại. Bạn có thể chuyển đổi nó hoặc đọc nó như là một yếu tố bằng cách đặt colClass trong read.table.

— tháng sáu
nguồn

4

Thông thường, điều này là do bạn đã không nói với R rằng nhãn là biến phân loại. Các read.csvcố gắng chức năng để đoán loại để sử dụng cho mỗi cột và nếu nó trông giống như một cột số thì đó là những gì nó sẽ sử dụng. Bạn có thể kiểm tra cách R lưu trữ biến bằng strhàm. Bạn có thể buộc read.csvđọc biến dưới dạng một yếu tố (hoặc số hoặc ...) bằng cách sử dụng colClassesđối số. Hoặc bạn có thể thay đổi nhãn thành một yếu tố sau khi đọc nó bằng cách sử dụngfactor chức năng.

Nếu đây không phải là trường hợp thì chúng tôi cần thêm thông tin về dữ liệu của bạn. Các kết quả từ việc chạy strtrên khung dữ liệu của bạn có thể sẽ hữu ích.

— Greg tuyết
nguồn