Tôi đang xây dựng một công cụ dự báo tương tác (bằng python) như một sự trợ giúp cho việc dự báo được thực hiện trong tổ chức của tôi. Cho đến nay, quá trình dự báo chủ yếu do con người điều khiển, với các nhà dự báo đồng hóa dữ liệu trong mạng lưới thần kinh tự nhiên của họ và sử dụng cảm giác ruột đã học để đưa ra dự đoán. Từ một nghiên cứu xác minh dự báo dài hạn và nghiên cứu mô hình dự đoán tôi đã thực hiện, tôi đã tìm thấy những gì bạn có thể mong đợi; các nhà dự báo khác nhau thể hiện những thành kiến khác nhau, ảnh hưởng của một số dự báo dường như bị cường điệu hóa và những dự báo quan trọng khác dường như bị bỏ qua và nói chung hiệu suất dự báo là tầm thường so với các mô hình thực nghiệm tương đối đơn giản.
Các dự báo sẽ tiếp tục là thủ công, nhưng tôi đang cố gắng xây dựng một công cụ hữu ích để cung cấp cho các nhà dự báo một lượng hóa tốt hơn về các tác động tương đối của các yếu tố dự báo. Ngoài ra còn có các hiệu ứng quan trọng như ảnh hưởng theo mùa thường bị bỏ qua mà tôi muốn công cụ này làm nổi bật cho người dùng. Tôi đang mong đợi một mức độ phản ứng dữ dội và sự hoài nghi về quy trình mô hình hóa từ một số nhà dự báo 'có kinh nghiệm' hơn (nhiều người trong số họ có ít kiến thức chính thức về thống kê), vì vậy, việc truyền thông ít nhất cũng quan trọng và chính hiệu suất của mô hình đạt được một sự cải thiện có thể đo lường được trong độ chính xác dự báo.
Các mô hình tôi đang phát triển có thành phần hồi quy tự động mạnh, đôi khi được sửa đổi đáng kể bởi các sự kiện hiển thị dưới dạng giá trị đo được trong một số dự đoán, trong thời gian không có sự kiện, gần bằng không. Điều này phù hợp với mô hình tinh thần mà các nhà dự báo sử dụng. Phần quan trọng là có thể chứng minh các phép đo 'sự kiện' nào có ảnh hưởng nhất trong việc đưa dự đoán ra khỏi giá trị hồi quy tự động cho bất kỳ dự báo cụ thể nào. Tôi hình ảnh quá trình theo cách này; người dự báo sẽ đoán giá trị đoán tốt nhất của họ, mô hình gợi ý một giá trị khác và người dự báo hỏi tại sao. Mô hình trả lời một cái gì đó như "xem ở đây, giá trị của công cụ dự đoán này làm tăng giá trị dự báo trong Mùa hè. Nếu là Mùa đông, nó sẽ di chuyển theo cách khác. Tôi biết có những phép đo khác,
Bây giờ, hãy tưởng tượng mô hình là một hồi quy tuyến tính đơn giản. Người ta có thể tưởng tượng việc hiển thị 'hiệu ứng' tương đối của các yếu tố dự đoán dựa trên sự kiện bằng cách nhân giá trị với mô hình đồng hiệu quả và hiển thị dưới dạng biểu đồ thanh đơn giản. Tất cả các thanh từ các yếu tố dự đoán khác nhau cộng với độ lệch tổng so với giá trị AR, và điều này cho thấy rõ ràng và rõ ràng những cái mà trong trường hợp này, có ảnh hưởng mạnh mẽ.
Vấn đề là quá trình được dự báo hiển thị mức độ phi tuyến tính cao trong các yếu tố dự đoán, hoặc ít nhất, tôi đã thành công hơn nhiều với các thuật toán học máy phi tuyến tính hộp đen (rừng ngẫu nhiên và GBM) so với GLM tập dữ liệu này. Lý tưởng nhất là tôi muốn có thể thay đổi liền mạch mô hình hoạt động 'dưới mui xe' mà không cần thay đổi trải nghiệm người dùng, vì vậy tôi cần một số cách chung để chứng minh một cách đơn giản tầm quan trọng của các phép đo khác nhau mà không cần sử dụng một số phương pháp cụ thể của thuật toán. Cách tiếp cận hiện tại của tôi sẽ là bán tuyến tính các hiệu ứng bằng cách đặt tất cả các giá trị về 0 ngoại trừ một yếu tố dự đoán, ghi lại độ lệch dự đoán và sau đó lặp lại cho tất cả các yếu tố dự đoán, hiển thị kết quả trong biểu đồ thanh được đề cập ở trên. Trong sự hiện diện của phi tuyến tính mạnh, điều này có thể không hoạt động tốt.