Tôi đã nghiên cứu một phương pháp mới để phân tích và phân tích bộ dữ liệu để xác định và cô lập các nhóm con của dân số mà không biết trước bất kỳ đặc điểm nào của nhóm phụ. Mặc dù phương pháp này hoạt động đủ tốt với các mẫu dữ liệu nhân tạo (tức là các bộ dữ liệu được tạo riêng cho mục đích xác định và phân tách các tập hợp con của dân số), tôi muốn thử kiểm tra nó với dữ liệu trực tiếp.
Những gì tôi đang tìm kiếm là một nguồn dữ liệu có sẵn miễn phí (tức là không bảo mật, không độc quyền). Tốt nhất là một trong đó có phân phối lưỡng kim hoặc đa phương thức hoặc rõ ràng bao gồm nhiều tập hợp con không thể dễ dàng tách ra thông qua các phương tiện truyền thống. Tôi sẽ đi đâu để tìm thông tin như vậy?