Kiểm tra thống kê tốt nhất cho một chuỗi thời gian là gì?


16

Tôi có một chuỗi thời gian đơn giản với 5-10 điểm dữ liệu trên mỗi dữ liệu được đặt đều đặn. Tôi tự hỏi đâu là cách tốt nhất để xác định xem hai bộ dữ liệu có khác nhau không. Tôi có nên thử kiểm tra t trên từng điểm dữ liệu hay nhìn vào khu vực dưới các đường cong hoặc có một mô hình đa biến nào đó sẽ hoạt động tốt hơn không?


Bạn có ý nghĩa gì bởi "khác biệt"?
Shane

Bạn có ý nghĩa gì với "5-10 điểm dữ liệu trên mỗi tập dữ liệu "?
S. Kolassa - Tái lập Monica

Tôi nghĩ rằng anh ta có một bộ sưu tập nhiều chuỗi thời gian, mỗi chuỗi có 5-10 quan sát.
Rob Hyndman

Tôi vẫn nghĩ rằng câu hỏi này gần như không thể trả lời mà không hiểu "khác biệt" nghĩa là gì ...
Shane

Đơn xin việc của tôi cho câu hỏi kém. Nói cách khác, ý tôi là liệu trong suốt chuỗi thời gian (chứ không phải ở từng điểm riêng lẻ) có sự khác biệt giữa hai nhóm điều trị. Sẽ có biến thể giữa các chủ đề (mà tôi đoán sẽ cần phải được tính đến) cũng như biến thể giữa các nhóm (đó là điều tôi quan tâm).
Dave

Câu trả lời:


11

Bạn sẽ cần phải xác định chính xác những gì bạn có nghĩa là "khác nhau". Bạn cũng sẽ cần xác định những giả định nào bạn muốn đưa ra về cấu trúc tương quan nối tiếp trong mỗi chuỗi thời gian.

Với các bài kiểm tra t, bạn đang so sánh giá trị trung bình của mỗi nhóm và bạn cho rằng các nhóm bao gồm các quan sát độc lập với phương sai bằng nhau (phần sau đôi khi được nới lỏng). Khi kiểm tra chuỗi thời gian, giả định về tính độc lập thường không hợp lý, nhưng sau đó bạn cần thay thế nó bằng một cấu trúc tương quan đã chỉ định - ví dụ: bạn có thể giả sử rằng chuỗi thời gian tuân theo các quy trình AR (1) với tự động tương đương. Do đó, thậm chí so sánh các phương tiện của hai hoặc nhiều chuỗi thời gian là khó khăn hơn đáng kể so với dữ liệu độc lập.

Tôi sẽ chỉ định cẩn thận những giả định mà tôi sẵn sàng đưa ra cho mỗi chuỗi thời gian và những gì tôi muốn so sánh, sau đó sử dụng một bootstrap tham số (dựa trên mô hình giả định) để thực hiện thử nghiệm.


6

Có thể lặp đi lặp lại các biện pháp anova là những gì bạn muốn. Nó cho phép bạn so sánh các đối tượng (các yếu tố liên chủ đề) trong khi lấy cấu trúc tương quan của "chuỗi thời gian" cho mỗi đối tượng (yếu tố bên trong đối tượng). Đây là một phương pháp dễ dàng nhưng có niên đại và có thể được tìm thấy trong ngữ cảnh của "các mô hình tuyến tính chung", nó cần một số tính năng bổ sung (ví dụ như tính toàn cầu). Một cách khác có thể là các mô hình tuyến tính hỗn hợp cho phép các cấu trúc tương quan tổng quát hơn (thậm chí AR (1) như Rob đề xuất) và dữ liệu không cân bằng.


2

Nếu bạn muốn giả sử xu hướng tuyến tính đơn giản, bạn có thể lấy chênh lệch của từng bộ dữ liệu tại các thời điểm khác nhau và kiểm tra độ dốc của đường bằng không.

Mùa đông -Ralph

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.