Tôi có một loạt các hồ sơ khách hàng được lưu trữ trong một cụm elaticsearch . Những hồ sơ này hiện được sử dụng để tạo các nhóm mục tiêu cho đăng ký email của chúng tôi.
Các nhóm mục tiêu hiện được hình thành thủ công bằng cách sử dụng các khả năng tìm kiếm theo khía cạnh của elaticsearch (như có được tất cả các khách hàng nam ở độ tuổi 23 với một xe và 3 trẻ em).
Làm cách nào tôi có thể tự động tìm kiếm các nhóm thú vị - sử dụng khoa học dữ liệu, học máy, phân cụm hoặc một cái gì khác?
Ngôn ngữ lập trình r dường như là một công cụ tốt cho nhiệm vụ này, nhưng tôi không thể hình thành một phương pháp tìm kiếm nhóm như vậy. Một giải pháp là bằng cách nào đó tìm các cụm khách hàng lớn nhất và sử dụng chúng làm nhóm mục tiêu, vì vậy câu hỏi là:
Làm cách nào tôi có thể tự động chọn các cụm lớn nhất của các khách hàng tương tự (tương tự theo các tham số mà tôi không biết tại thời điểm này)?
Ví dụ: chương trình của tôi sẽ kết nối với elaticsearch, giảm dữ liệu khách hàng sang CSV và sử dụng tập lệnh ngôn ngữ R sẽ thấy rằng phần lớn khách hàng là nam không có con và một phần lớn khách hàng khác có xe và màu mắt của họ là màu nâu.