Làm thế nào để mã hóa ngày là đầu vào trong mạng thần kinh?


12

Tôi đang sử dụng mạng lưới thần kinh để dự đoán một chuỗi thời gian. Câu hỏi tôi phải đối mặt bây giờ là làm thế nào để tôi mã hóa ngày / giờ / số không. của mỗi đầu vào được đặt làm đầu vào cho mạng thần kinh?

Tôi có nên sử dụng 1 trong số mã hóa C (được sử dụng cho các loại mã hóa) như được mô tả ở đây không?

Hay tôi chỉ nên cho nó ăn thời gian (tính bằng mili giây kể từ 1-1-1970)?

Hoặc là cho nó ăn thời gian không cần thiết miễn là tôi cho nó ăn phần còn lại của dữ liệu theo thời gian?


Tôi không chắc tại sao bạn nghĩ cho nó thời gian không cần thiết nếu bạn đang sử dụng mạng lưới thần kinh để dự đoán một chuỗi thời gian .
scaaahu

có nhiều cách để mã hóa ngày / giờ. nó sẽ giúp để biết bản chất của chuỗi thời gian. nó không phải là một thứ gì đó để loại trừ hoặc loại trừ.
vzn

@vzn Tôi đang cố gắng dự đoán một chuỗi thời gian tài chính nói chung. Nếu điều đó là hữu ích.
Shaya RC

Câu trả lời:


17

Mạng lưới thần kinh không phải là phép thuật. Nếu bạn đối xử với họ như họ và chỉ ném dữ liệu vào họ mà không nghĩ rằng bạn sẽ có một khoảng thời gian rất tồi tệ.

Bạn cần dừng lại và tự hỏi mình "Có phải là một phần nghìn giây kể từ năm 1970 thực sự sẽ là dự đoán về sự kiện mà tôi quan tâm không?" Câu trả lời bạn nên đến ngay lập tức là không. Tại sao? Đối với mọi trường hợp bạn thực sự quan tâm (các sự kiện trong tương lai, quá khứ đã xảy ra), biến thời gian sẽ có giá trị lớn hơn bất kỳ giá trị nào mà biến thời gian sẽ lấy trong dữ liệu đào tạo của bạn. Một biến như vậy là rất khó để giúp đỡ. Tệ hơn nữa, nó có khả năng gây ra tình trạng quá mức (một vấn đề nghiêm trọng đối với các mô hình phi tuyến tính mạnh mẽ như mạng thần kinh) nếu bạn không cẩn thận.

Bây giờ những gì có thể có ý nghĩa là một biến như tuần trong năm hoặc tháng có thể giúp bạn mô hình hóa các hiệu ứng theo mùa hoặc hàng năm. Tôi đã thực hiện một số công việc trong dự đoán bệnh nông nghiệp trong đó ngày Julian cuối cùng là một biến số rất quan trọng. Dựa trên kinh nghiệm này, tôi nghi ngờ rằng bạn nên mã hóa loại biến này thành một biến phân loại hơn là thứ tự, kinh nghiệm của bạn có thể rất tốt. Lưu ý rằng tháng hoặc tuần trong năm là các sự kiện lặp lại mà người ta có thể thấy nhiều lần trong dữ liệu đào tạo của bạn và có thể giải thích tại sao một biến như vậy có thể ảnh hưởng đến kết quả tài chính. Tương phản điều này với mili giây kể từ năm 1970, đây chỉ là một giá trị tăng đơn điệu.

Cuối cùng, từ tuyên bố của bạn "Hoặc là cho nó ăn thời gian không cần thiết miễn là tôi cho nó ăn phần còn lại theo thời gian?" có vẻ như bạn có thể không nắm bắt tốt cách thức hoạt động của mạng lưới thần kinh. Với một mạng nơ ron phản hồi tiêu chuẩn, thứ tự bạn cung cấp cho mạng, dữ liệu của bạn sẽ không ảnh hưởng đến các dự đoán. Thứ tự có thể ảnh hưởng đến việc đào tạo nếu bạn đang sử dụng giảm dần độ dốc ngẫu nhiên hoặc mini-batch, nhưng đây chỉ là một tạo tác của phương pháp đào tạo lặp (trái ngược với lô). Nếu bạn muốn mô hình hóa sự phụ thuộc tạm thời với mạng thần kinh, bạn sẽ cần sử dụng một cái gì đó như cửa sổ trượt hoặc mạng thần kinh tái phát.


2

[-1,1][0,1]STôin(t)

f(t)f(t)dt= =ft+gtgtft

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.