Tại sao dự đoán về chuỗi thời gian này lại khá nghèo nàn?


15

Tôi đang cố gắng học cách sử dụng Mạng thần kinh. Tôi đã đọc hướng dẫn này .

Sau khi lắp Mạng thần kinh trên Chuỗi thời gian bằng cách sử dụng giá trị tại để dự đoán giá trị tại t + 1 , tác giả có được biểu đồ sau, trong đó đường màu xanh là chuỗi thời gian, màu xanh lá cây là dự đoán trên dữ liệu tàu, màu đỏ là dự đoán về dữ liệu thử nghiệm (anh ấy đã sử dụng phân tách thử nghiệm)tt+1p1

và gọi nó là "Chúng ta có thể thấy rằng mô hình đã làm một công việc khá kém là phù hợp với cả bộ dữ liệu huấn luyện và bộ kiểm tra. Về cơ bản, nó dự đoán giá trị đầu vào giống như đầu ra."

Sau đó, tác giả quyết định sử dụng , và để dự đoán giá trị tại . Làm như vậy có đượctt1t2t+1

p2

và nói "Nhìn vào biểu đồ, chúng ta có thể thấy nhiều cấu trúc hơn trong các dự đoán."

Câu hỏi của tôi

Tại sao "nghèo" đầu tiên? nó trông gần như hoàn hảo với tôi, nó dự đoán mọi thay đổi hoàn hảo!

Và tương tự, tại sao thứ hai tốt hơn? "Cấu trúc" ở đâu? Đối với tôi nó có vẻ nghèo hơn nhiều so với cái đầu tiên.

Nói chung, khi nào một dự đoán về chuỗi thời gian là tốt và khi nào nó là xấu?


3
Như một nhận xét chung, hầu hết các phương pháp ML là để phân tích cắt ngang và cần điều chỉnh để áp dụng cho chuỗi thời gian. Lý do chính là tự động tương quan dữ liệu, trong khi ở ML thường dữ liệu được giả định độc lập trong hầu hết các phương pháp phổ biến
Aksakal

11
Nó thực hiện một công việc tuyệt vời là dự đoán mọi thay đổi ... ngay sau khi nó xảy ra!
hobbs

@hobbs, tôi không cố dùng t, t-1, t-2 v.v để dự đoán t + 1. Tôi đã tự hỏi nếu bạn biết có bao nhiêu thuật ngữ trong quá khứ là tốt nhất để sử dụng. Nếu chúng ta sử dụng quá nhiều, chúng ta có quá mức không?
Euler_Salter

Nó sẽ được chiếu sáng nhiều hơn để vẽ các phần dư.
reo katoa

Câu trả lời:


23

Đó là một loại ảo ảnh quang học: mắt nhìn vào biểu đồ và thấy rằng các biểu đồ màu đỏ và màu xanh nằm ngay bên cạnh nhau. Vấn đề là chúng nằm ngay cạnh nhau theo chiều ngang , nhưng vấn đề quan trọng là chiều dọckhoảng cách. Mắt dễ dàng nhìn thấy khoảng cách nhất giữa các đường cong trong không gian hai chiều của đồ thị Cartesian, nhưng điều quan trọng là khoảng cách một chiều trong một giá trị t cụ thể. Ví dụ: giả sử chúng ta có các điểm A1 = (10,100), A2 = (10.1, 90), A3 = (9.8,85), P1 = (10.1.100.1) và P2 = (9.8, 88). Mắt tự nhiên sẽ so sánh P1 với A1, vì đó là điểm gần nhất, trong khi P2 sẽ được so sánh với A2. Vì P1 gần với A1 hơn P2 so với A3, nên P1 sẽ giống như một dự đoán tốt hơn. Nhưng khi bạn so sánh P1 với A1, bạn chỉ nhìn vào mức độ A1 có thể lặp lại những gì nó đã thấy trước đó; đối với A1, P1 không phải là một dự đoán. So sánh đúng là giữa P1 v. A2 và P2 v. A3 và trong so sánh này P2 tốt hơn so với P1. Sẽ rõ ràng hơn nếu, ngoài âm mưu y_actual và y_pred chống lại t, còn có đồ thị của (y_pred-y_actual) chống lại t.


2
Đây là câu trả lời tốt hơn vì người khác thậm chí không đề cập đến lý do tại sao một dự báo "đẹp" thực sự kém, trong khi bạn làm một công việc tuyệt vời ở đó!
Richard Hardy

17

Tại sao "nghèo" đầu tiên? nó trông gần như hoàn hảo với tôi, nó dự đoán mọi thay đổi hoàn hảo!

Đó là một dự báo được gọi là "thay đổi". Nếu bạn nhìn kỹ hơn vào biểu đồ 1, bạn sẽ thấy rằng sức mạnh dự đoán chỉ trong việc sao chép gần như chính xác giá trị nhìn thấy lần cuối. Điều đó có nghĩa là mô hình học được không có gì tốt hơn, và nó coi chuỗi thời gian là một bước đi ngẫu nhiên. Tôi đoán rằng vấn đề có thể là trong thực tế bạn sử dụng dữ liệu thô mà bạn cung cấp cho mạng thần kinh. Những dữ liệu này là không cố định gây ra tất cả các rắc rối.


8
Trong dự báo, đây được gọi là dự báo "ngây thơ", tức là sử dụng lần cuối được quan sát như dự báo
Aksakal

Cảm ơn bạn! @Aksakal bạn có biết nên sử dụng bao nhiêu giá trị trước đó để dự đoán không?
Euler_Salter

Tập trung vào văn phòng phẩm. Một vài độ trễ cố định sẽ khá tốt cho chuỗi thời gian này. Tốt hơn 100 độ trễ không cố định.
Alexey Burnakov

trong chuỗi thời gian có một cách để có một dự đoán tốt về cấu trúc lag thông qua ACF và PACF, tra cứu diễn đàn này, có nhiều bài viết về cách nó được thực hiện
Aksakal

@AlexeyBurnakov vậy có nghĩa là tôi nên biến nó thành văn phòng phẩm?
Euler_Salter
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.