Có hợp lệ để tổng hợp một chuỗi thời gian để làm cho nó trông có ý nghĩa hơn không?


10

Một câu hỏi khác về chuỗi thời gian từ tôi.

Tôi có một bộ dữ liệu cung cấp các hồ sơ hàng ngày về các sự cố bạo lực trong một bệnh viện tâm thần trong hơn ba năm. Với sự giúp đỡ từ câu hỏi trước đây của tôi, tôi đã loay hoay với nó và bây giờ tôi thấy vui hơn một chút.

Điều tôi có bây giờ là loạt phim hàng ngày rất ồn ào. Nó dao động dữ dội, lên và xuống, từ 0 tại thời điểm lên đến 20. Sử dụng các lô hoàng thổ và gói dự báo (mà tôi rất có thể khuyên dùng cho những người mới như tôi) Tôi chỉ nhận được một đường thẳng hoàn toàn, với khoảng tin cậy lớn từ dự báo.

Tuy nhiên, tổng hợp hàng tuần hoặc hàng tháng dữ liệu có ý nghĩa hơn rất nhiều. Họ quét xuống từ đầu của bộ truyện, và sau đó tăng trở lại ở giữa. Âm mưu hoàng thổ và gói dự báo đều tạo ra thứ gì đó có ý nghĩa hơn rất nhiều.

Nó không cảm thấy giống như gian lận mặc dù. Tôi chỉ thích các phiên bản tổng hợp bởi vì chúng trông đẹp mà không có giá trị thực sự với nó?

Hoặc sẽ tốt hơn để tính trung bình di động và sử dụng nó làm cơ sở? Tôi sợ rằng tôi không hiểu lý thuyết đằng sau tất cả những điều này đủ tốt để tự tin về những gì được chấp nhận

Câu trả lời:


8

Điều này hoàn toàn phụ thuộc vào chuỗi thời gian của bạn và hiệu ứng bạn muốn khám phá / bằng chứng, v.v.

Một điều quan trọng ở đây là, bạn có loại thời gian nào trong dữ liệu của mình. Tạo một phổ dữ liệu của bạn và xem tần số nào là phổ biến trong dữ liệu của bạn.

Dù sao, bạn không nói dối khi bạn quyết định hiển thị các giá trị tổng hợp. Khi bạn đang tìm kiếm các hiệu ứng xảy ra trong nhiều tuần (như, bạo lực hơn vào mùa hè khi thời tiết nóng) thì đó là điều nên làm.

Có lẽ bạn cũng có thể xem qua Hilbert Huang Transform. Điều này sẽ cung cấp cho bạn Chức năng Chế độ Nội tại rất tiện dụng cho các phân tích trực quan.


12

Việc dự báo tổng hợp dữ liệu là rất phổ biến để tăng tỷ lệ tín hiệu / nhiễu. Có một số bài báo về ảnh hưởng của tổng hợp thời gian đến độ chính xác dự báo trong kinh tế, ví dụ. Những gì bạn có thể nhìn thấy trong dữ liệu hàng ngày là tín hiệu yếu đang bị nhiễu bởi nhiễu, trong khi dữ liệu hàng tuần và hàng tháng đang hiển thị tín hiệu mạnh hơn rõ hơn.

Việc bạn muốn sử dụng tổng hợp thời gian phụ thuộc hoàn toàn vào mục đích của bạn là gì. Nếu bạn cần dự báo về các sự cố hàng ngày, thì tổng hợp sẽ không được sử dụng nhiều. Nếu bạn quan tâm đến việc khám phá tác động của một số đồng biến đối với tần suất xuất hiện và tất cả dữ liệu của bạn có sẵn trên cơ sở hàng ngày, thì tôi có thể sẽ sử dụng dữ liệu hàng ngày vì nó sẽ cho kích thước mẫu lớn hơn và có thể cho phép bạn phát hiện các hiệu ứng dễ dàng hơn.

Vì bạn đang sử dụng gói dự báo, có lẽ bạn quan tâm đến dự báo chuỗi thời gian. Vì vậy, bạn cần dự báo hàng ngày, dự báo hàng tuần hoặc dự báo hàng tháng? Câu trả lời sẽ xác định liệu tổng hợp có phù hợp với bạn hay không.


1

Vấn đề (tiến thoái lưỡng nan) mà bạn gặp phải dường như là một trong việc chọn khoảng thời gian lấy mẫu tối ưu (hoặc tốt hơn) để sửa đổi dự báo của bạn. Để bắt đầu, hãy xem văn bản liên kết của cuốn sách nổi tiếng của Brown, cũng sẽ đủ điều kiện là một tài liệu tham khảo tốt. Tất cả tập trung vào "cân bằng rủi ro của việc không nhận thấy sự thay đổi nhanh chóng chống lại sự biến đổi vốn có của dữ liệu và chi phí sửa đổi kế hoạch thường xuyên". Nếu bạn chưa sẵn sàng để xem lại dự báo của mình (và các quyết định thúc đẩy nó) hàng ngày, bạn không thực sự cần phải sử dụng dữ liệu hàng ngày (ồn ào nhất). Một điểm quan trọng, thường bị mất trong tài liệu dự báo đương đại, đó là dự báo chỉ cần thiết để hỗ trợ đưa ra quyết định (trừ khi người ta cũng biết cách lấy niềm vui từ chúng).

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.