Chiến lược tăng cường dữ liệu cho dự báo chuỗi thời gian

11

Tôi đang xem xét hai chiến lược để thực hiện "tăng dữ liệu" trong dự báo chuỗi thời gian.

Đầu tiên, một chút nền tảng. Công cụ dự đoán để dự báo bước tiếp theo của chuỗi thời gian là một chức năng thường phụ thuộc vào hai điều, trạng thái quá khứ của chuỗi thời gian, nhưng cũng là trạng thái trong quá khứ của người dự đoán: $P$ $\lbrace A_i\rbrace$

P ({A_{i \leq t - 1}}, P_{S_{t - 1}})

$P(\lbrace A_{i\leq t-1}\rbrace,P_{S_{t-1}})$

Nếu chúng tôi muốn điều chỉnh / huấn luyện hệ thống của mình để có được tốt , thì chúng tôi sẽ cần đủ dữ liệu. Đôi khi dữ liệu có sẵn sẽ không đủ, vì vậy chúng tôi xem xét thực hiện tăng dữ liệu. $P$

Cách tiếp cận đầu tiên

Giả sử chúng ta có chuỗi thời gian , với . Và giả sử rằng chúng ta có đáp ứng điều kiện sau: . $\lbrace A_i \rbrace$ $1 \leq i \leq n$ $\epsilon$ $0<\epsilon < |A_{i+1} - A_i| \forall i \in \lbrace 1, \ldots,n\rbrace$

Chúng ta có thể xây dựng chuỗi thời gian mới , trong đó là sự hiện thực hóa phân phối . $\lbrace B_i = A_i+r_i\rbrace$ $r_i$ $N(0,\frac{\epsilon}{2})$

Sau đó, thay vì giảm thiểu chức năng mất chỉ hơn , chúng tôi cũng làm điều đó qua . Vì vậy, nếu quá trình tối ưu hóa thực hiện bước, chúng ta phải "khởi tạo" bộ dự đoán lần và chúng ta sẽ tính khoảng trạng thái bên trong của bộ dự đoán. $\lbrace A_i \rbrace$ $\lbrace B_i \rbrace$ $m$ $2m$ $2m(n-1)$

Cách tiếp cận thứ hai

Chúng tôi tính toán như trước đây, nhưng chúng tôi không cập nhật trạng thái bên trong của người dự đoán bằng cách sử dụng , nhưng . Chúng tôi chỉ sử dụng hai chuỗi cùng nhau tại thời điểm tính toán hàm mất, vì vậy chúng tôi sẽ tính toán các trạng thái bên trong của bộ dự đoán xấp xỉ . $\lbrace B_i \rbrace$ $\lbrace B_i \rbrace$ $\lbrace A_i \rbrace$ $m(n-1)$

Tất nhiên, có ít công việc tính toán ở đây (mặc dù thuật toán hơi xấu hơn một chút), nhưng bây giờ nó không còn quan trọng nữa.

Sự nghi ngờ

Vấn đề là: từ quan điểm thống kê, đâu là lựa chọn "tốt nhất"? Và tại sao?

Trực giác của tôi nói với tôi rằng cái đầu tiên tốt hơn, bởi vì nó giúp "bình thường hóa" các trọng số liên quan đến trạng thái bên trong, trong khi cái thứ hai chỉ giúp bình thường hóa các trọng số liên quan đến chuỗi thời gian quan sát được.

Thêm:

Bất kỳ ý tưởng khác để làm tăng dữ liệu cho dự báo chuỗi thời gian?
Làm thế nào để cân trọng lượng dữ liệu tổng hợp trong tập huấn luyện?

time-series data-augmentation

— castarco
nguồn

5

Bất kỳ ý tưởng khác để làm tăng dữ liệu cho dự báo chuỗi thời gian?

Tôi hiện đang suy nghĩ về cùng một vấn đề. Tôi đã tìm thấy bài báo "Tăng cường dữ liệu cho phân loại chuỗi thời gian bằng cách sử dụng mạng nơ ron kết hợp" của Le Guennec et al. mà không bao gồm dự báo tuy nhiên. Vẫn là các phương pháp tăng cường được đề cập ở đó trông đầy hứa hẹn. Các tác giả truyền đạt 2 phương pháp:

Cắt cửa sổ (WS)

Một phương pháp đầu tiên được lấy cảm hứng từ cộng đồng thị giác máy tính [8,10] bao gồm trích xuất các lát cắt từ chuỗi thời gian và thực hiện phân loại ở cấp độ lát. Phương pháp này đã được giới thiệu cho chuỗi thời gian trong [6]. Khi đào tạo, mỗi lát được trích xuất từ một chuỗi thời gian của lớp y được gán cùng một lớp và một trình phân loại được học bằng cách sử dụng các lát. Kích thước của lát là một tham số của phương pháp này. Tại thời điểm thử nghiệm, mỗi lát cắt từ chuỗi thời gian thử nghiệm được phân loại bằng cách sử dụng phân loại đã học và một phiếu bầu đa số được thực hiện để quyết định nhãn dự đoán. Phương pháp này được gọi là cắt cửa sổ (WS) sau đây.

Cửa sổ cong vênh (WW)

Kỹ thuật tăng dữ liệu cuối cùng mà chúng tôi sử dụng là cụ thể hơn theo chuỗi thời gian. Nó bao gồm làm cong vênh một lát được chọn ngẫu nhiên của chuỗi thời gian bằng cách tăng tốc lên hoặc xuống, như trong Hình 2. Kích thước của lát cắt ban đầu là một tham số của phương pháp này. Hình 2 cho thấy một chuỗi thời gian từ bộ dữ liệu EC EC200200 và dữ liệu được chuyển đổi tương ứng. Lưu ý rằng phương pháp này tạo ra chuỗi thời gian đầu vào có độ dài khác nhau. Để giải quyết vấn đề này, chúng tôi thực hiện cắt cửa sổ trên chuỗi thời gian đã chuyển đổi để tất cả có độ dài bằng nhau. Trong bài báo này, chúng tôi chỉ xem xét các tỷ lệ cong vênh bằng 0.5hoặc 2, nhưng các tỷ lệ khác có thể được sử dụng và tỷ lệ tối ưu thậm chí có thể được điều chỉnh tốt thông qua xác nhận chéo trên tập huấn luyện. Sau đây, phương pháp này sẽ được gọi là cong vênh cửa sổ (WW).

Hình 2 từ giấy

Các tác giả đã giữ 90% của loạt không thay đổi (tức là WS được đặt thành một lát 90% và cho WW 10% của loạt đã bị biến dạng). Các phương pháp được báo cáo để giảm lỗi phân loại trên một số loại dữ liệu chuỗi (thời gian), ngoại trừ các biểu diễn 1D của phác thảo hình ảnh. Các tác giả đã lấy dữ liệu của họ từ đây: http : //timeseries classification.com

Làm thế nào để cân trọng lượng dữ liệu tổng hợp trong tập huấn luyện?

Trong quá trình tăng cường hình ảnh, do việc tăng cường không được dự kiến sẽ thay đổi loại hình ảnh, nên nó thường được coi là trọng số của nó như bất kỳ dữ liệu thực nào. Dự báo chuỗi thời gian (và thậm chí phân loại chuỗi thời gian) có thể khác nhau:

Một chuỗi thời gian không dễ nhận thấy như một đối tượng tiếp giáp với con người, vì vậy tùy thuộc vào mức độ bạn can thiệp vào nó, nó có còn là cùng một lớp không? Nếu bạn chỉ cắt và làm cong một chút và các lớp là khác biệt trực quan, điều này có thể không gây ra vấn đề cho các nhiệm vụ phân loại
Để dự báo, tôi sẽ lập luận rằng

2.1 WS vẫn là một phương thức hay. Cho dù bạn nhìn vào 90% của bộ truyện nào, bạn vẫn sẽ mong đợi một dự báo dựa trên cùng một quy tắc => toàn bộ trọng lượng.

2.2 WW: Càng gần đến cuối truyện, tôi càng thận trọng. Theo trực giác, tôi sẽ đưa ra hệ số trọng lượng trượt giữa 0 (cong vênh ở cuối) và 1 (cong vênh ở đầu), giả sử rằng các đặc điểm gần đây nhất của đường cong là phù hợp nhất.

— người viết
nguồn

5

Bất kỳ ý tưởng khác để làm tăng dữ liệu cho dự báo chuỗi thời gian?

Một câu trả lời khác với cách tiếp cận khác, dựa trên "Tăng cường dữ liệu trong không gian đặc trưng" của DeVries và Taylor.

Trong công việc này, chúng tôi chứng minh rằng ngoại suy giữa các mẫu trong không gian tính năng có thể được sử dụng để tăng bộ dữ liệu và cải thiện hiệu suất của các thuật toán học có giám sát. Lợi ích chính của phương pháp của chúng tôi là độc lập với miền , không đòi hỏi kiến thức chuyên môn và do đó có thể được áp dụng cho nhiều loại vấn đề khác nhau.

Âm thanh hứa hẹn với tôi. Về nguyên tắc, bạn có thể lấy bất kỳ trình mã hóa tự động nào để tạo các biểu diễn trong không gian tính năng. Các tính năng này có thể được nội suy hoặc ngoại suy.

Hình dưới đây cho thấy một phép nội suy mẫu của hai vectơ không gian đặc trưng và (lưu ý rằng các kết quả tích cực hơn được báo cáo để ngoại suy từ hai vectơ, xem chi tiết). Kết quả là vectơ tăng cường sau đó được giải mã trở lại không gian đầu vào và đưa vào mạng để đào tạo. $C_j$ $C_k$ $C'$

Bài báo một lần nữa chỉ bao gồm phân loại trình tự. Nhưng một lần nữa IMO các nguyên tắc là giống nhau để phân tích hồi quy. Bạn nhận được dữ liệu mới từ phân phối có lẽ giống với dữ liệu thực của bạn, đó là những gì bạn muốn.

kiến trúc của AE augmented

Nếu chúng ta xây dựng thêm nguyên tắc tạo dữ liệu này bằng một mạng thần kinh, chúng ta sẽ kết thúc với Mạng đối thủ tạo (GAN) . Chúng có thể được sử dụng theo cách tương tự để tạo ra dữ liệu tăng cường, có lẽ sẽ là cách hiện đại nhất để làm như vậy.

— người viết
nguồn

3

Gần đây tôi đã thực hiện một cách tiếp cận khác lấy cảm hứng từ bài báo này từ Bergmeir, Hyndman và Benitez.

Ý tưởng là lấy một chuỗi thời gian và trước tiên áp dụng một phép biến đổi như phép biến đổi Box Cox hoặc Yeo-johnson (giải quyết một số vấn đề với Box Cox) để ổn định phương sai của chuỗi, sau đó áp dụng phân tách STL trên chuỗi biến đổi cho loạt theo mùa hoặc phân rã hoàng thổ để lấy phần dư của chuỗi. Lấy những phần dư này và bootstrapping chúng với bootstrap khối di chuyển để tạo ra chuỗi bổ sungCác chuỗi bổ sung này sau đó có xu hướng ban đầu và tính thời vụ của chuỗi bắt đầu được thêm lại vào phần dư khởi động trước khi đảo ngược biến đổi năng lượng được áp dụng trong bước đầu tiên. $B$ $B$

Theo cách này, có thể tạo ra nhiều chuỗi thời gian bổ sung cần thiết thể hiện chuỗi thời gian ban đầu khá tốt. Dưới đây là một ví dụ về ứng dụng trên một số dữ liệu thực để tạo thêm chuỗi thời gian tương tự:

Ở đây, phần bổ sung được hiển thị bằng cách sử dụng phép biến đổi Yeo-johnson chứ không phải Box Cox như đề xuất trong bài báo gốc.

— Aesir
nguồn