Tôi là người mới trong trang và khá mới về thống kê và R. Tôi đang làm việc trong một dự án cho trường đại học với mục tiêu tìm kiếm mối tương quan giữa mưa và mực nước chảy trên sông. Một khi mối tương quan được chứng minh tôi muốn dự báo / dự đoán nó.
Dữ liệu tôi có một bộ dữ liệu trong vài năm (lấy cứ sau 5 phút) cho một con sông cụ thể có chứa:
- Lượng mưa tính bằng milimét
- Lưu lượng sông tính bằng mét khối trên giây
Con sông này không có tuyết, vì vậy mô hình chỉ dựa trên mưa và thời gian. Thỉnh thoảng có nhiệt độ đóng băng, nhưng tôi nghĩ về việc loại bỏ những khoảng thời gian đó ra khỏi dữ liệu là ngoại lệ vì tình huống đó nằm ngoài phạm vi cho dự án của tôi.
Ví dụ Ở đây bạn có một vài lô dữ liệu mẫu từ một cơn mưa và nước dâng lên vài giờ sau đó.
Dòng màu đỏ là dòng chảy của sông. Màu cam là mưa. Bạn có thể thấy nó luôn mưa trước khi nước dâng lên trên sông. Có một số mưa bắt đầu lại vào cuối chuỗi thời gian, nhưng nó sẽ ảnh hưởng đến dòng chảy của dòng sông sau này.
Sự tương quan là ở đó. Dưới đây là những gì tôi đã làm trong R để chứng minh mối tương quan bằng cách sử dụng ccf trong R:
- mối tương quan chéo
- biến hàng đầu
- Tụt hậu
Đây là dòng R của tôi được sử dụng cho ví dụ thứ hai (một khoảng thời gian mưa):
ccf(arnoiaex1$Caudal, arnoiaex1$Precip, lag.max=1000, plot=TRUE, main="Flow & Rain")
Giải thích của tôi là:
- rằng mưa dẫn (xảy ra đầu tiên),
- có một mối tương quan đáng kể rằng các đỉnh đạt độ trễ (tôi có thể kiểm tra con số chính xác, tôi biết phần đó).
- Tôi không biết làm thế nào để tìm ra thời gian mà mối tương quan ảnh hưởng đến dòng chảy của dòng sông, tôi nghĩ rằng cái tên này là Giữ lại. Những gì tôi thấy là biểu đồ theo hình dạng tương tự của biểu đồ đầu tiên, khi dòng sông mất nước sau cơn mưa. Tôi không nếu dựa vào điều đó tôi có thể nói rằng độ lưu giữ kéo dài từ khi nó đạt cực đại đến (Tôi có thể kiểm tra điều này trong đối tượng được tạo trong khung dữ liệu được trả về và xem khi mực nước trở về giá trị của trước khi mưa mưa. Có đúng không? Có cách nào tốt hơn để tìm sự lưu giữ không?
ccf
Tôi có đúng không
Về chuỗi thời gian . Chuỗi thời gian này không có tính định kỳ hoặc tính thời vụ. Mưa có thể đến bất cứ lúc nào và gây ra hiệu ứng. Nó giảm vào mùa hè, nhưng nó vẫn xảy ra, đó là một khu vực có rất nhiều mưa quanh năm.
Mô hình và dự báo.
Tôi không biết làm thế nào để tạo ra một mô hình để có thể thực hiện một dự báo cho tôi biết một dòng sông sẽ tăng khối lượng bao nhiêu sau một thời gian mưa. Tôi đã thử một số arima
, auto arima
nhưng không thành công. Tôi nên sử dụng Arima
, vars
hoặc mô hình đa biến khác nhau? Bất kỳ liên kết đến một ví dụ sẽ giúp đỡ rất nhiều.
Xin vui lòng, cho tôi biết nếu bạn biết cách tốt nhất để tạo dự đoán này, tôi nên sử dụng mô hình nào. Có một vài điều khác tôi đang xem xét nhưng đơn giản là đưa chúng ra khỏi lời giải thích này. Tôi có thể chia sẻ một số dữ liệu nếu cần.