Giả sử tôi có hơn 20.000 chuỗi thời gian hàng tháng kéo dài từ ngày 1 tháng 1 đến ngày 11 tháng 12. Mỗi trong số này đại diện cho dữ liệu bán hàng toàn cầu cho một sản phẩm khác nhau. Điều gì sẽ xảy ra nếu, thay vì tính toán dự báo cho từng người trong số họ, tôi chỉ muốn tập trung vào một số lượng nhỏ sản phẩm "thực sự quan trọng"?
Tôi có thể xếp hạng các sản phẩm đó theo tổng doanh thu hàng năm và cắt giảm danh sách bằng cách sử dụng Pareto cổ điển. Tuy nhiên, dường như đối với tôi, mặc dù chúng không đóng góp nhiều vào điểm mấu chốt, một số sản phẩm rất dễ dự báo rằng việc bỏ chúng đi sẽ là phán xét tồi. Một sản phẩm bán được 50 đô la mỗi tháng trong 10 năm qua nghe có vẻ không nhiều, nhưng nó đòi hỏi rất ít nỗ lực để tạo ra các dự đoán về doanh số trong tương lai mà tôi có thể làm điều đó.
Vì vậy, giả sử tôi chia các sản phẩm của mình thành bốn loại: doanh thu cao / dễ dự báo - doanh thu thấp / dễ dự báo - doanh thu cao / khó dự báo - doanh thu thấp / khó dự báo.
Tôi nghĩ sẽ hợp lý nếu chỉ để lại những chuỗi thời gian thuộc về nhóm thứ tư. Nhưng làm thế nào chính xác tôi có thể đánh giá "dự báo"?
Hệ số biến đổi có vẻ như là một điểm khởi đầu tốt (tôi cũng nhớ đã thấy một số bài viết về nó một thời gian trước đây). Nhưng điều gì sẽ xảy ra nếu chuỗi thời gian của tôi thể hiện tính thời vụ / thay đổi cấp độ / hiệu ứng lịch / xu hướng mạnh mẽ?
Tôi sẽ tưởng tượng rằng tôi chỉ nên dựa vào đánh giá của tôi về sự biến đổi của thành phần ngẫu nhiên chứ không phải là một trong những dữ liệu "thô". Hay tôi đang thiếu một cái gì đó?
Có ai vấp phải một vấn đề tương tự trước đây? Các bạn sẽ làm thế nào về nó?
Như mọi khi, bất kỳ trợ giúp được đánh giá rất cao!