R đi kèm với rất nhiều bộ dữ liệu và có vẻ như nó sẽ không phải là vấn đề lớn để sao chép hầu hết các ví dụ bạn đã trích dẫn với một vài dòng mã. Bạn cũng có thể thấy gói mlbench hữu ích, đặc biệt là các bộ dữ liệu tổng hợp bắt đầu bằng mlbench.*
. Một số minh họa được đưa ra dưới đây.
Bạn sẽ tìm thấy các ví dụ bổ sung bằng cách xem Chế độ xem nhiệm vụ cụm trên CRAN. Ví dụ, gói fpc có một trình tạo tích hợp cho các bộ dữ liệu điểm chuẩn cụm "hình mặt" ( rFace
).
Các cân nhắc tương tự áp dụng cho Python, nơi bạn sẽ tìm thấy các bài kiểm tra và bộ dữ liệu điểm chuẩn thú vị để phân cụm với scikit-learn .
Kho lưu trữ học máy của UCI cũng lưu trữ rất nhiều bộ dữ liệu , nhưng tốt hơn hết bạn nên tự mô phỏng dữ liệu bằng ngôn ngữ bạn chọn.