Mô hình cuối cùng từ Xác thực chéo chuỗi thời gian

10

Tôi có kinh nghiệm trước đây với xác thực chéo K-gập 'bình thường' để điều chỉnh mô hình và tôi hơi bối rối bởi ứng dụng trong các mô hình chuỗi thời gian.

Theo hiểu biết của tôi, đối với các mô hình chuỗi thời gian, hệ quả của việc xác thực chéo là thủ tục 'khởi nguồn tiến' được mô tả bởi Hyndman . Điều này rất có ý nghĩa với tôi và mã dưới đây cho thấy việc sử dụng tsCVhàm trong R, từ blog của Hydman , để cho thấy các lỗi khác nhau như thế nào so với CV so với toàn bộ dữ liệu trong một lần.

library(fpp)
e <- tsCV(dj, rwf, drift=TRUE, h=1)
sqrt(mean(e^2, na.rm=TRUE))
## [1] 22.68249
sqrt(mean(residuals(rwf(dj, drift=TRUE))^2, na.rm=TRUE))
## [1] 22.49681

Bây giờ, trong liên kết trên, nó đề cập rằng tham số trôi được ước tính lại ở mỗi nguồn gốc dự báo mới. Trong CV 'bình thường' tôi sẽ có một lưới các tham số mà tôi sẽ đánh giá theo từng nếp gấp để tôi có thể lấy trung bình để xác định các tham số tốt nhất để sử dụng. Sau đó, tôi sẽ sử dụng các tham số 'tốt nhất' đó để phù hợp với tập huấn luyện đầy đủ và sử dụng đó làm mô hình cuối cùng để đánh giá trên tập kiểm tra đã tổ chức trước đó của tôi. Lưu ý, đây là xác thực chéo lồng nhau vì vậy tôi không đào tạo về bộ kiểm tra của mình tại bất kỳ thời điểm nào.

Đây rõ ràng không phải là trường hợp với các 'lăn về phía trước nguồn gốc' thủ tục, nơi các thông số được tối ưu hóa cho mỗi lần (ít nhất là trong phương pháp R như bats, tbats, auto.arima, vv). Tôi có nhầm lẫn khi nghĩ về phương pháp này về mặt điều chỉnh tham số mô hình hay tôi sẽ chọn các tham số mô hình chuỗi thời gian để đặt cho mô hình cuối cùng sẽ được sử dụng như thế nào? Hoặc điều chỉnh tham số không xem xét vấn đề với các mô hình chuỗi thời gian trong đó tối ưu hóa dường như là một phần của sự phù hợp mô hình và kết quả của CV là chỉ nói mỗi mô hình thực hiện tốt như thế nào? Và rằng mô hình cuối cùng được xây dựng với phần lớn dữ liệu ở cuối là mô hình tôi sẽ sử dụng?

Tôi nhận ra điều này có thể được nhắc lại trong một câu hỏi thậm chí đơn giản hơn. Sau khi xác thực chéo ('nguồn gốc chuyển tiếp'), tôi chỉ sử dụng mô hình cuối cùng được chế tạo (với superset lớn nhất làm mô hình được trang bị cuối cùng? Hay đề xuất gì?

time-series forecasting cross-validation

— cdeterman
nguồn

Trước chức năng tsCV, tôi đã tạo một chức năng tương tự không đào tạo lại hoặc ước tính lại bất kỳ điều gì trong khi xác thực chéo. Tò mò liệu những gì tôi đã làm có sai hay không.

— DataJack

1

Bạn có thể kết hợp cuộn gốc chuyển tiếp với xác thực chéo k-gấp (hay còn gọi là backtesting với xác thực chéo). Xác định các nếp gấp lên trước một lần và tại mỗi lần lăn lặp lại qua các nếp gấp k, đào tạo trên k-1 và kiểm tra trên k. Liên kết của tất cả các lần kiểm tra được tổ chức cung cấp cho bạn một phạm vi bảo hiểm hoàn chỉnh của toàn bộ tập dữ liệu tại thời điểm đó và các nếp gấp bao gồm tập dữ liệu k-1 lần tại thời điểm đó, bạn có thể tổng hợp theo bất kỳ cách nào phù hợp (ví dụ: ). Sau đó, điểm số đào tạo và kiểm tra riêng như bạn thường sẽ có được điểm số đào tạo / kiểm tra riêng biệt tại thời điểm đó.

Khi tối ưu hóa các tham số, trước tiên hãy tạo một bộ giữ riêng biệt, sau đó thực hiện xác thực chéo chỉ được mô tả trên các dữ liệu còn lại. Để mỗi tham số được tối ưu hóa, bạn cần quyết định xem tham số đó có độc lập với thời gian hay không (để bạn có thể thực hiện tối ưu hóa trong tất cả các lần lăn) hoặc phụ thuộc vào thời gian (để tham số được tối ưu hóa riêng biệt mỗi lần). Nếu sau này, bạn có thể biểu diễn tham số dưới dạng hàm thời gian (có thể là tuyến tính) và sau đó tối ưu hóa các hệ số độc lập với thời gian của hàm đó trong mọi thời điểm.

— Michael Brundage
nguồn

0

Nếu bạn đã tối ưu hóa các tham số cho dữ liệu thử nghiệm, bạn sẽ phù hợp một phần dữ liệu của mình với dữ liệu thử nghiệm thay vì dữ liệu đào tạo. Bạn muốn biết phương pháp nào tốt nhất đối với dữ liệu bị giữ lại, ví dụ, không nên đặt gamma nào trong mô hình Holt Winters.

— AnscombesGimlet
nguồn

Bạn đúng nhưng bạn nhận xét khiến tôi nhận ra tôi đã thất bại khi nói tình huống này sẽ được xác thực chéo để các mô hình không được đào tạo về bộ kiểm tra giữ. Tôi đang nói về cả điều chỉnh tham số trong chính nó (ví dụ: một phương thức duy nhất) và trong lựa chọn mô hình / điều chỉnh lồng nhau.

— cdeterman

Giả sử tôi hoàn thành xác thực chéo và Holt Winters đã giành chiến thắng, tôi có chỉnh sửa lại bộ dữ liệu đầy đủ để lấy gamma cho mô hình cuối cùng không?

— cdeterman