Phân tích chuỗi thời gian với nhiều giá trị 0


19

Vấn đề này thực sự là về phát hiện cháy, nhưng nó rất giống với một số vấn đề phát hiện phân rã phóng xạ. Các hiện tượng đang được quan sát là cả lẻ tẻ và rất khác nhau; do đó, một chuỗi thời gian sẽ bao gồm các chuỗi số 0 dài bị gián đoạn bởi các giá trị biến.

Mục tiêu không chỉ đơn thuần là nắm bắt các sự kiện (phá vỡ các số 0), mà là đặc tính định lượng của chính các sự kiện. Tuy nhiên, các cảm biến bị giới hạn, và do đó đôi khi sẽ ghi lại số 0 ngay cả khi "thực tế" khác không. Vì lý do này, các số 0 phải được đưa vào khi so sánh các cảm biến.

Cảm biến B có thể nhạy hơn cảm biến A và tôi muốn có thể mô tả điều đó theo thống kê. Đối với phân tích này, tôi không có "sự thật", nhưng tôi có Cảm biến C, độc lập với Cảm biến A & B. Do đó, kỳ vọng của tôi là thỏa thuận tốt hơn giữa A / B và C cho thấy thỏa thuận tốt hơn với "sự thật". (Điều này có vẻ run rẩy, nhưng bạn sẽ phải tin tưởng tôi-- Tôi đang ở trên nền tảng vững chắc ở đây, dựa trên những gì được biết từ các nghiên cứu khác về các cảm biến).

Sau đó, vấn đề là làm thế nào để định lượng "thỏa thuận tốt hơn về chuỗi thời gian". Tương quan là sự lựa chọn rõ ràng, nhưng sẽ bị ảnh hưởng bởi tất cả các số 0 (không thể bỏ qua) và tất nhiên bị ảnh hưởng không tương xứng bởi các giá trị tối đa. RMSE cũng có thể được tính toán, nhưng sẽ được cân nhắc mạnh mẽ đối với hoạt động của các cảm biến trong trường hợp gần như bằng không.

Câu 1: Cách tốt nhất để áp dụng tỷ lệ logarit cho các giá trị khác không, sau đó sẽ được kết hợp với các số 0 trong phân tích chuỗi thời gian là gì?

Câu 2: "Thực hành tốt nhất" nào bạn có thể đề xuất cho phân tích chuỗi thời gian của loại này, trong đó hành vi ở các giá trị khác không là trọng tâm, nhưng giá trị 0 chiếm ưu thế và không thể loại trừ?

Câu trả lời:


11

Để phục hồi câu hỏi của bạn, Làm thế nào để nhà phân tích đối phó với thời gian dài không có nhu cầu mà không theo mô hình cụ thể?

Câu trả lời cho câu hỏi của bạn là Phân tích nhu cầu không liên tục hoặc Phân tích dữ liệu thưa thớt. Điều này phát sinh bình thường khi bạn có "nhiều số không" so với số lượng không có số không. Vấn đề là có hai biến ngẫu nhiên; thời gian giữa các sự kiện và kích thước dự kiến ​​của sự kiện. Như bạn đã nói, autocorrelation (acf) của bộ bài đọc hoàn chỉnh là vô nghĩa do chuỗi các số 0 giả mạo tăng cường acf. Bạn có thể theo đuổi các chủ đề như "Phương pháp của Croston là một quy trình dựa trên mô hình chứ không phải là quy trình dựa trên dữ liệu. Phương pháp của Croston dễ bị ảnh hưởng bởi các ngoại lệ và thay đổi / xu hướng / mức độ thay đổi theo tỷ lệ nhu cầu, tức là nhu cầu chia cho số lượng giai đoạn kể từ nhu cầu cuối cùng. Cách tiếp cận khắt khe hơn nhiều có thể là theo đuổi "Dữ liệu thưa thớt - Dữ liệu cách đều nhau" hoặc tìm kiếm như thế. Một giải pháp khá khéo léo đã được đề xuất cho tôi bởi Giáo sư Ramesh Sharda của OSU và tôi đã sử dụng nó trong một số năm trong thực tiễn tư vấn của mình. Nếu một chuỗi có các điểm thời gian phát sinh doanh số và thời gian dài mà không có doanh số phát sinh, có thể chuyển đổi doanh số thành doanh số mỗi kỳ bằng cách chia doanh số được quan sát cho số lượng thời gian không bán được do đó có được tỷ lệ. Sau đó, có thể xác định một mô hình giữa tỷ lệ và khoảng thời gian giữa doanh số lên đến đỉnh điểm trong một tỷ lệ dự báo và một khoảng dự báo. Bạn có thể tìm hiểu thêm về điều này tại autobox.com và google "nhu cầu không liên tục" Nếu một chuỗi có các điểm thời gian phát sinh doanh số và thời gian dài mà không có doanh số phát sinh, có thể chuyển đổi doanh số thành doanh số mỗi kỳ bằng cách chia doanh số được quan sát cho số lượng thời gian không bán được do đó có được tỷ lệ. Sau đó, có thể xác định một mô hình giữa tỷ lệ và khoảng thời gian giữa doanh số lên đến đỉnh điểm trong một tỷ lệ dự báo và một khoảng dự báo. Bạn có thể tìm hiểu thêm về điều này tại autobox.com và google "nhu cầu không liên tục" Nếu một chuỗi có các điểm thời gian phát sinh doanh số và thời gian dài mà không có doanh số phát sinh, có thể chuyển đổi doanh số thành doanh số mỗi kỳ bằng cách chia doanh số được quan sát cho số lượng thời gian không bán được do đó có được tỷ lệ. Sau đó, có thể xác định một mô hình giữa tỷ lệ và khoảng thời gian giữa doanh số lên đến đỉnh điểm trong một tỷ lệ dự báo và một khoảng dự báo. Bạn có thể tìm hiểu thêm về điều này tại autobox.com và google "nhu cầu không liên tục"


1
Tôi có một vấn đề về dự báo với nhu cầu không liên tục. Tôi đã được yêu cầu giải quyết. Tôi biết có một số phần mềm cụ thể cho thời điểm dự báo này nhưng không miễn phí. Bạn có thể vui lòng cho tôi biết nếu bạn biết bất kỳ chức năng tích hợp nào trong phần mềm nguồn mở (ví dụ như R) để giải quyết vấn đề này không? Tôi đã tìm kiếm nhưng không thể tìm thấy nó cho đến nay ... Cảm ơn!
Assu

1
@assu: Tôi không biết về bất kỳ phần mềm miễn phí nào đáp ứng nhu cầu của bạn.
IrishStat

4
@assu. Các croston()chức năng trong forecastgói vào R sẽ thực hiện phương pháp Croston cho dữ liệu dự báo nhu cầu liên tục.
Rob Hyndman
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.