Một lựa chọn là có được tần suất của tất cả các kết hợp mua sản phẩm; chọn một vài kết hợp phổ biến nhất; sau đó xây dựng mô hình hồi quy để dự đoán kết hợp đã chọn của từng cá nhân. Ví dụ, với hồi quy logistic nhị phân, bạn có thể dự đoán được việc mua một) Rượu vang trắng, Brie, Dâu tây và Nho so với b) Rượu vang đỏ, Cheddar và Gouda. Với hơn 2 kết hợp như vậy hoặc nếu bạn muốn bao gồm danh mục "không có gì ở trên", hồi quy logistic đa thức có lẽ sẽ là phương pháp được lựa chọn.
Lưu ý rằng chỉ bao gồm các combo thông thường có nghĩa là bạn sẽ có số lượng khả thi hơn của mỗi loại nhưng bạn sẽ loại trừ những cái khác, ít nhất là từ quy trình này. Tôi có thể tưởng tượng 7 vật phẩm tạo ra hàng tá combo mỗi thứ được chọn bởi ít nhất một vài người. Đây có thể là quá nhiều danh mục cho kích thước mẫu của bạn. Hơn nữa, nếu một kết hợp được chọn bởi chỉ một vài người, mô hình của bạn sẽ có rất ít thông tin để làm việc.
Một lựa chọn khác là sử dụng phân tích cụm để đến một vài bộ vật phẩm có xu hướng được mua cùng nhau. Với 7 mục, có thể bạn sẽ kết thúc với ít hơn 4 cụm, điều này có thể giúp công việc của bạn dễ dàng hơn. Nếu bạn thử phân tích cụm và thấy kết quả không khả thi, không có lý do gì bạn phải sử dụng chúng: chỉ cần quay lại cách tiếp cận dựa trên tần suất được mô tả ở trên. Trong trường hợp này, nếu tôi đọc đúng, bạn đang tìm kiếm một loạt các danh mục mô tả và thú vị nhất, và khi thiết lập điều đó, bạn không cần phải lo lắng về mức độ tự do hoặc so sánh nhiều hoặc bất kỳ mối quan tâm nào có thể áp dụng nếu bạn đã thử nhiều phương pháp để thực hiện một số thử nghiệm suy luận.