Vấn đề ở đây là để có được một phương trình phân tích dữ liệu quan sát thành tín hiệu và nhiễu. Nếu dữ liệu của bạn đơn giản thì phương pháp hồi quy của bạn có thể hoạt động. Cần thận trọng để hiểu một số giả định mà họ đang thực hiện với Tiên tri. Bạn nên hiểu rõ hơn về những gì Prophet làm, vì nó không chỉ phù hợp với một mô hình đơn giản mà còn cố gắng thêm một số cấu trúc.
Ví dụ, một số phản ánh mà tôi đã thực hiện sau khi đọc phần giới thiệu được viết tốt của họ có thể giúp bạn đánh giá. Tôi xin lỗi trước nếu tôi hiểu sai cách tiếp cận của họ, và muốn được sửa chữa nếu có.
1) Ví dụ dẫn đầu của họ có hai điểm dừng trong xu hướng nhưng họ chỉ nắm bắt được điểm rõ ràng nhất.
2) Họ bỏ qua bất kỳ và tất cả cấu trúc ARIMA phản ánh chuỗi ngẫu nhiên bị bỏ qua hoặc giá trị sử dụng các giá trị lịch sử của Y để hướng dẫn dự báo.
3) Họ bỏ qua mọi động lực có thể có (hiệu ứng chì và độ trễ) của chuỗi ngẫu nhiên và xác định do người dùng đề xuất. Hiệu ứng hồi quy nguyên nhân của nhà tiên tri chỉ đơn giản là đương thời.
4) Không có nỗ lực nào được thực hiện để xác định dịch chuyển bước / cấp trong chuỗi hoặc xung theo mùa, ví dụ: thay đổi nửa giờ HIỆU QUẢ HÀNG NGÀY do một số sự kiện bên ngoài không xác định. Prophet giả định "tăng trưởng tuyến tính đơn giản" thay vì xác nhận nó bằng cách kiểm tra các khả năng thay thế. Để có ví dụ về điều này, hãy xem Dự báo các đơn đặt hàng định kỳ cho một doanh nghiệp đăng ký trực tuyến bằng Facebook Prophet và R
5) Sines và Cosines là một cách không rõ ràng để đối phó với tính thời vụ, trong khi các hiệu ứng theo mùa như ngày trong tuần, ngày trong tháng, tuần, tháng trong năm là hiệu quả / nhiều thông tin hơn khi xử lý các hiệu ứng do con người gây ra (đối phó với con người!).
Đề xuất tần suất 365,25 cho các mẫu hàng năm không có ý nghĩa gì vì chúng tôi không thực hiện cùng một hành động vào cùng một ngày như năm ngoái, trong khi hoạt động hàng tháng thì bền bỉ hơn nhiều, nhưng Prophet dường như không cung cấp 11 chỉ số hàng tháng Lựa chọn. Tần suất hàng tuần là 52 có ý nghĩa rất nhỏ bởi vì chúng tôi không có 52 tuần mỗi năm.
6) Không có nỗ lực nào được thực hiện để xác nhận các quá trình lỗi là Gaussian để các thử nghiệm có ý nghĩa có thể được thực hiện.
7) Không quan tâm đến phương sai lỗi mô hình là đồng nhất, nghĩa là, không thay đổi một cách xác định tại các thời điểm cụ thể trong thời gian gợi ý Bình phương tối thiểu có trọng số. Không cần quan tâm đến việc tìm một biến đổi công suất tối ưu để xử lý phương sai lỗi tỷ lệ thuận với Giá trị mong đợi Khi nào (và tại sao) bạn nên lấy nhật ký phân phối (số)? .
8) Người dùng phải chỉ định trước tất cả các hiệu ứng dẫn và trễ có thể xảy ra xung quanh các sự kiện / ngày lễ. Ví dụ, doanh số hàng ngày thường bắt đầu tăng vào cuối tháng 11, phản ánh hiệu quả lâu dài của Giáng sinh.
9) Không có lo ngại rằng các lỗi kết quả là không có cấu trúc gợi ý các cách để cải thiện mô hình thông qua kiểm tra chẩn đoán cho đủ.
10) Rõ ràng không có mối quan tâm với việc cải thiện mô hình bằng cách xóa cấu trúc không đáng kể.
11) Không có cơ sở để có được một họ các dự báo mô phỏng trong đó các giới hạn độ tin cậy có thể không nhất thiết phải đối xứng thông qua việc khởi động các lỗi của mô hình với sự cho phép của các bất thường có thể xảy ra.
12) Cho phép người dùng đưa ra các giả định về xu hướng (# điểm dừng xu hướng và điểm dừng thực tế) cho phép tính linh hoạt không mong muốn / không thể sử dụng khi đối mặt với phân tích quy mô lớn mà theo tên của nó được thiết kế cho các ứng dụng quy mô lớn rảnh tay.