Chuỗi thời gian đa biến trong R. Cách tìm mô hình tương quan bị trễ và xây dựng để dự báo


16

Tôi là người mới trong trang và khá mới về thống kê và R. Tôi đang làm việc trong một dự án cho trường đại học với mục tiêu tìm kiếm mối tương quan giữa mưa và mực nước chảy trên sông. Một khi mối tương quan được chứng minh tôi muốn dự báo / dự đoán nó.

Dữ liệu tôi có một bộ dữ liệu trong vài năm (lấy cứ sau 5 phút) cho một con sông cụ thể có chứa:

  • Lượng mưa tính bằng milimét
  • Lưu lượng sông tính bằng mét khối trên giây

Con sông này không có tuyết, vì vậy mô hình chỉ dựa trên mưa và thời gian. Thỉnh thoảng có nhiệt độ đóng băng, nhưng tôi nghĩ về việc loại bỏ những khoảng thời gian đó ra khỏi dữ liệu là ngoại lệ vì tình huống đó nằm ngoài phạm vi cho dự án của tôi.

Ví dụ Ở đây bạn có một vài lô dữ liệu mẫu từ một cơn mưa và nước dâng lên vài giờ sau đó.

Ví dụ lớn hơn một vài ngày

Ví dụ ngắn hơn chỉ là một khoảng thời gian mưa

Dòng màu đỏ là dòng chảy của sông. Màu cam là mưa. Bạn có thể thấy nó luôn mưa trước khi nước dâng lên trên sông. Có một số mưa bắt đầu lại vào cuối chuỗi thời gian, nhưng nó sẽ ảnh hưởng đến dòng chảy của dòng sông sau này.

Sự tương quan là ở đó. Dưới đây là những gì tôi đã làm trong R để chứng minh mối tương quan bằng cách sử dụng ccf trong R:

  • mối tương quan chéo
  • biến hàng đầu
  • Tụt hậu

Đây là dòng R của tôi được sử dụng cho ví dụ thứ hai (một khoảng thời gian mưa):

ccf(arnoiaex1$Caudal, arnoiaex1$Precip, lag.max=1000, plot=TRUE, main="Flow & Rain")

kết quả ccf cho ví dụ nhỏ 2

Giải thích của tôi là:

  • rằng mưa dẫn (xảy ra đầu tiên),
  • có một mối tương quan đáng kể rằng các đỉnh đạt độ trễ (tôi có thể kiểm tra con số chính xác, tôi biết phần đó).450
  • Tôi không biết làm thế nào để tìm ra thời gian mà mối tương quan ảnh hưởng đến dòng chảy của dòng sông, tôi nghĩ rằng cái tên này là Giữ lại. Những gì tôi thấy là biểu đồ theo hình dạng tương tự của biểu đồ đầu tiên, khi dòng sông mất nước sau cơn mưa. Tôi không nếu dựa vào điều đó tôi có thể nói rằng độ lưu giữ kéo dài từ khi nó đạt cực đại đến (Tôi có thể kiểm tra điều này trong đối tượng được tạo trong khung dữ liệu được trả về và xem khi mực nước trở về giá trị của trước khi mưa mưa. Có đúng không? Có cách nào tốt hơn để tìm sự lưu giữ không?450800ccf

Tôi có đúng không

Về chuỗi thời gian . Chuỗi thời gian này không có tính định kỳ hoặc tính thời vụ. Mưa có thể đến bất cứ lúc nào và gây ra hiệu ứng. Nó giảm vào mùa hè, nhưng nó vẫn xảy ra, đó là một khu vực có rất nhiều mưa quanh năm.

Mô hình và dự báo. Tôi không biết làm thế nào để tạo ra một mô hình để có thể thực hiện một dự báo cho tôi biết một dòng sông sẽ tăng khối lượng bao nhiêu sau một thời gian mưa. Tôi đã thử một số arima, auto arimanhưng không thành công. Tôi nên sử dụng Arima, varshoặc mô hình đa biến khác nhau? Bất kỳ liên kết đến một ví dụ sẽ giúp đỡ rất nhiều.

Xin vui lòng, cho tôi biết nếu bạn biết cách tốt nhất để tạo dự đoán này, tôi nên sử dụng mô hình nào. Có một vài điều khác tôi đang xem xét nhưng đơn giản là đưa chúng ra khỏi lời giải thích này. Tôi có thể chia sẻ một số dữ liệu nếu cần.


bạn đang tìm kiếm phân tích can thiệp (tập hợp con được gọi là "nghiên cứu sự kiện" trong nghiên cứu xã hội)
Konstantinos

Câu trả lời:


3

Bạn cần sử dụng các hành vi ACF & PACF của mình để giúp bạn xác định mô hình nào phù hợp với dữ liệu của bạn hơn (ví dụ: sự tồn tại của phân rã chậm trong biểu đồ ACF chỉ ra rằng sự khác biệt có thể cần thiết để làm cho chuỗi ổn định hơn. Sự biến đổi là cần thiết. Biến động phải ít thay đổi hơn và trong các đường màu xanh nếu bạn sử dụng phép biến đổi đúng (chuỗi tĩnh). Một khi bạn thực hiện loạt văn phòng phẩm của mình, hãy nghĩ xem mô hình AR, MA, ARMA hoặc ARIMA nào phù hợp. Trong dự án của tôi, tôi đã làm như sau để giúp lựa chọn mô hình:

Biểu đồ ACF hiển thị giá trị tương đối lớn ở độ trễ 2 ( xem phần này nằm trong ô của bạn ). Ngoài ra, về cơ bản, nó trở thành số không ở độ trễ lớn hơn hai. Điều này cho thấy rằng một mô hình MA (2) có thể phù hợp với dữ liệu và sau đó bằng cách nhìn vào biểu đồ PACF, chúng tôi ngay lập tức nhận thấy rằng mối tương quan bằng không gần như ở tất cả độ trễ. Điều này có thể gợi ý rằng mô hình không có bất kỳ phần AR nào trên đó ( điều chỉnh phần này theo cốt truyện của bạn). Do đó, một trong những mô hình ứng cử viên của chúng tôi có thể là ARIMA (p, d, q) với các tham số p = 0, d = 1 và q = 1 or2. Tôi cũng đã thử một số đơn đặt hàng cao hơn của MA và xem xét một số khả năng có một phần AR trong mô hình để so sánh kết quả từ AIC, AICc và BIC và quyết định mô hình cuối cùng. Bước tiếp theo, bạn sẽ cần chạy một số xét nghiệm chẩn đoán để đảm bảo bạn đã chọn đúng mô hình và không có mẫu nào trong phần dư của bạn (ACF & PACF cho phần dư, giá trị p cho thống kê Ljung-Box, biểu đồ cho phần dư và Cốt truyện QQ). Hy vọng nó giúp!

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.