Thì
có rất nhiều công cụ và lib với chức năng có sẵn.
Lựa chọn nào tùy thuộc vào việc bạn muốn sử dụng gui cho công việc của mình hay bạn muốn nhúng nó vào một số chương trình khác.
Các công cụ khai thác dữ liệu độc lập (có các ohters như WEKA với giao diện Java):
- Công cụ khai thác nhanh
- trái cam
- Rô gui cho R
- KIẾM
Văn bản dựa trên:
Thiên Bình:
- Scikit cho Python
- Mahout trên Hadoop
Nếu bạn biết một ngôn ngữ lập trình đủ tốt, tôi sẽ sử dụng lib cho ngôn ngữ đó hoặc thử R. Nếu không bạn có thể thử một trong những công cụ với gui.
Một ví dụ về cây trong R:
# we are using the iris dataset
data(iris)
# for our tree based model we use the rpart package
# to download it type install.packages("rpart")
library(rpart)
# Building the tree
fit <- rpart(Species ~ Petal.Length + Petal.Width, method="class", data=iris)
# Plot the tree
plot(fit)
text(fit)
Như đã đề xuất, việc phân tích với R yêu cầu bạn tự viết mã, nhưng bạn sẽ tìm thấy một gói cho hầu hết các nhiệm vụ phân loại sẽ hoạt động tốt. Tổng quan có thể được tìm thấy ở đây Machine Learning Task View
Để bắt đầu với RapidMinder, bạn nên xem qua Youtube. Có một số screencasts, ngay cả đối với cây quyết định.