Điều chỉnh dự báo (hồi quy tuyến tính)


11

Tiết lộ đầy đủ: Tôi không phải là một nhà thống kê, tôi cũng không tự nhận là một. Tôi là một quản trị viên CNTT thấp. Hãy chơi nhẹ nhàng với tôi. :)

Tôi chịu trách nhiệm thu thập và dự báo sử dụng lưu trữ đĩa cho doanh nghiệp của chúng tôi. Chúng tôi thu thập lưu trữ sử dụng hàng tháng và sử dụng hồi quy tuyến tính 12 tháng đơn giản để dự báo (nói cách khác, chỉ mười hai tháng trước của dữ liệu được xem xét khi thực hiện chiếu). Chúng tôi sử dụng thông tin này để phân bổ và lập kế hoạch chi phí vốn, ví dụ: "Dựa trên mô hình này, chúng tôi sẽ cần mua số tiền x nếu lưu trữ trong y tháng để đáp ứng nhu cầu của chúng tôi." Tất cả điều này hoạt động đủ tốt để phù hợp với nhu cầu của chúng tôi.

Theo định kỳ, chúng tôi có các chuyển động một lần lớn trong các số của chúng tôi sẽ loại bỏ dự báo. Ví dụ: ai đó tìm thấy 500GB bản sao lưu cũ không còn cần thiết nữa và xóa chúng. Tốt cho họ để đòi lại không gian! Tuy nhiên, dự báo của chúng tôi hiện đang bị lệch do mức giảm lớn này trong một tháng. Chúng tôi luôn chấp nhận rằng một sự sụt giảm như thế này mất 9-10 tháng để thoát khỏi mô hình, nhưng đó có thể là một thời gian thực sự dài nếu chúng ta đang bước vào mùa kế hoạch chi phí vốn.

Tôi tự hỏi liệu có cách nào để xử lý các phương sai một lần này sao cho các giá trị dự báo không bị ảnh hưởng nhiều (ví dụ độ dốc của đường không thay đổi đáng kể), nhưng chúng được tính đến (ví dụ: thay đổi một lần trong giá trị y được liên kết với một thời điểm cụ thể). Những nỗ lực đầu tiên của chúng tôi trong việc giải quyết điều này đã mang lại một số kết quả xấu (ví dụ: đường cong tăng trưởng theo cấp số nhân). Chúng tôi thực hiện tất cả các xử lý của chúng tôi trong SQL Server nếu điều đó quan trọng.


Câu hỏi tuyệt vời. Chỉ cần làm rõ nhanh chóng. Bạn có muốn dự đoán những sự kiện này, hoặc, khi chúng xảy ra, điều chỉnh dự đoán mô hình được cung cấp thông tin mới của bạn?
Matthew Drury

1
Đúng vậy, không rõ liệu bạn có đang cố gắng "làm mịn" những sự kiện hiếm gặp này như ví dụ 500 GB để chúng không ảnh hưởng đến kết quả của bạn không hoặc nếu bạn đang cố gắng tính toán chúng nhiều hơn vì bạn muốn nắm bắt khi điều chỉnh chó cái để lưu trữ được thực hiện? Sự khác biệt là tinh tế: Trong lần đầu tiên, bạn muốn gần như bỏ qua điểm mới (sự kiện hiếm), nhưng int anh thứ hai, bạn muốn nhấn mạnh điểm (sự kiện hiếm). Nếu trước đây, hồi quy mạnh có lẽ là một phương pháp đơn giản cho bạn vì bạn đã sử dụng hồi quy tuyến tính. Xem tại đây: ats.ucla.edu/stat/r/dae/rreg.htm
StatsStudent 11/2/2016

Ngoài ra, bạn có sử dụng bất kỳ phần mềm nào để đưa ra dự đoán của mình và bạn có sử dụng khoảng tin cậy không?
StatsStudent 11/2/2016

Tôi có thể thêm một điều chỉnh sau khi thực tế. Trên thực tế, hầu hết thời gian tôi sẽ không biết về một sai lệch lớn cho đến khi tôi nhìn vào những con số của tháng tiếp theo và thấy một sự thay đổi lớn. Tôi không sử dụng bất kỳ phần mềm nào để đưa ra dự đoán; chỉ là một thủ tục được lưu trữ trong SQL Server để tính các giá trị hồi quy của tôi.
sbrown

Phản ứng nhanh: (a) Trước tiên tôi có thể phù hợp với AR (1) rất cơ bản để thay đổi cách sử dụng đĩa nhật ký? Về cơ bản, bạn đang ước tính một số tốc độ tăng trưởng dài hạn trong việc sử dụng đĩa và tốc độ tăng trưởng trong việc sử dụng đĩa sẽ quay trở lại xu hướng đó nhanh như thế nào sau một cú sốc. (aa) Bạn cũng có thể sử dụng dữ liệu khác và phù hợp với VAR (vectơ tự phát). (b) vứt bỏ tất cả dữ liệu> 12 tháng có thể không phải là điều tối ưu để làm. (c) OLS thông thường giảm thiểu tổng bình phương. Bạn có thể sử dụng một chức năng phạt khác (ví dụ: Huber) mạnh hơn đối với các ngoại lệ.
Matthew Gunn

Câu trả lời:


0

Đây là một gợi ý đơn giản. Tôi không biết liệu nó có hiệu quả với bạn không và có lẽ tôi nên bình luận như một bình luận, nhưng có vẻ như bạn cần nhiều đặc quyền hơn để bình luận hơn là trả lời.

Nếu tôi hiểu chính xác, số liệu bạn đang sử dụng là số lượng lưu trữ bạn đang sử dụng mỗi tháng. Có lẽ những mức tăng thông thường này và bạn muốn dự đoán số tiền sẽ có lúc nào đó trong tương lai nếu xu hướng tiếp tục. Khi bạn nhận ra rằng thay đổi lớn của mình đã xảy ra (ví dụ: 500 GB đã được phát hành), bạn có thể quay lại và thay đổi số liệu của các tháng trước không (ví dụ: xóa 500 GB khỏi tất cả chúng)? Về cơ bản những gì bạn sẽ làm là điều chỉnh số liệu của những tháng trước thành những gì họ nên có, nếu bạn biết thì những gì bạn biết bây giờ.

Tất nhiên tôi không khuyến nghị điều này trừ khi bạn chắc chắn rằng bạn có thể quay lại những con số cũ. Nhưng dự báo bạn muốn thực hiện âm thanh như nó thậm chí có thể được thực hiện trong Excel, trong trường hợp đó bạn có thể có nhiều phiên bản như bạn muốn.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.