Lasso-ing thứ tự của một độ trễ?


9

Giả sử tôi có dữ liệu theo chiều dọc có dạng (Tôi có nhiều quan sát, đây chỉ là dạng của một quan sát duy nhất). Tôi quan tâm đến các hạn chế đối với . không bị hạn chế tương đương với việc lấy với .Σ Σ Y j = α j + j - 1 Σ= 1 φ j Y j - + ε j ε j ~ N ( 0 , σ j )Y=(Y1,,YJ)N(μ,Σ)ΣΣ

Yj=αj+=1j1ϕjYj+εj
εjN(0,σj)

Điều này thường không được thực hiện vì nó yêu cầu ước tính các tham số hiệp phương sai . Một mô hình là "lag- " nếu chúng ta lấy tức là chúng ta chỉ sử dụng trước thuật ngữ để dự đoán từ lịch sử.k Y j = α j + k Σ= 1 φ j Y j - + ε j , k Y jO(J2)k

Yj=αj+=1kϕjYj+εj,
kYj

Những gì tôi thực sự muốn làm là sử dụng một số loại ý tưởng thu nhỏ để loại bỏ một số , như LASSO. Nhưng vấn đề là, tôi cũng muốn các phương pháp tôi sử dụng để thích mô hình đó là lag- đối với một số ; Tôi muốn xử phạt độ trễ của lệnh cao hơn nhiều so với độ trễ của lệnh thấp hơn. Tôi nghĩ rằng đây là điều mà chúng tôi đặc biệt muốn làm vì các yếu tố dự đoán có mối tương quan cao. k kϕjkk

Một vấn đề khác là nếu (nói) bị thu nhỏ về tôi cũng sẽ thích nếu bị thu hẹp về , tức là độ trễ tương tự được sử dụng trong tất cả các phân phối có điều kiện. 0 φ 36 0ϕ350ϕ360

Tôi có thể suy đoán về điều này, nhưng tôi không muốn phát minh lại bánh xe. Có bất kỳ kỹ thuật LASSO nào được thiết kế để giải quyết vấn đề này không? Tôi có tốt hơn không chỉ làm một cái gì đó hoàn toàn khác, như bao gồm từng bước của các đơn đặt hàng trễ? Vì không gian mô hình của tôi nhỏ, tôi thậm chí có thể sử dụng hình phạt cho vấn đề này?L0

Câu trả lời:


2

Bạn có thể thực hiện xác nhận chéo nhiều lần từ k = 0 đến mức tối đa là bao nhiêu và vẽ hiệu suất theo k. Vì mô hình đang được thử nghiệm trên dữ liệu mà nó chưa từng thấy trước đây, không có gì đảm bảo các mô hình phức tạp sẽ hoạt động tốt hơn và thực sự bạn sẽ thấy sự suy giảm hiệu suất nếu mô hình trở nên quá phức tạp do quá mức. Cá nhân tôi nghĩ rằng điều này là an toàn và dễ dàng để biện minh hơn là có một yếu tố hình phạt tùy ý, nhưng số dặm của bạn có thể thay đổi.

Tôi cũng không thực sự làm theo cách Lasso ra lệnh trả lời câu hỏi. Có vẻ như quá hạn chế, nó hoàn toàn buộc phải sắp xếp các hệ số. Trong khi câu hỏi ban đầu có thể kết thúc đối với một số dữ liệu có giải pháp trong đó không hoàn toàn giảm với l.ϕlj


Để thêm LaTeX vào câu hỏi của bạn, hãy đính kèm biểu thức giữa các ký hiệu đô la ($).
Patrick Coulombe

1
(1) Chỉ từ mô hình, không rõ ràng rằng thứ tự hệ số là mong muốn, nhưng thực chất nó là hợp lý. Ví dụ, trong một thử nghiệm lâm sàng về các biện pháp lặp đi lặp lại, không có lý do chính đáng nào để mong đợi rằng một nhiễu loạn nhỏ của sẽ ảnh hưởng ngẫu nhiên đến nhiều hơn một nhiễu loạn nhỏ của . LASSO đã ra lệnh sử dụng tốt hơn kiến ​​thức tiên nghiệm này, với rủi ro nhỏ rằng nó có thể không đúng. Y j Y j - 1Yj2YjYj1
anh chàng

(2) Nói chung, tôi sẽ không sử dụng chiến lược CV này ít nhất một phần vì nó quá giáo điều. Tôi có thể có được những dự đoán tốt hơn bằng cách thu nhỏ lại một cách hợp lý, thay vì ném nó ra hoàn toàn.
anh chàng

Nir, một nhận xét hữu ích về LASSO đã ra lệnh. Tôi đã chỉnh sửa câu trả lời của mình để toàn diện hơn một chút. Cảm ơn!
Sean Easter

Cảm ơn Sean. Guy, tôi không nghĩ đó là quá giáo điều. Bạn không đặt ak trong đá, mà là cho phép nó thay đổi. Các k nó chọn sẽ là lúc bắt đầu của quá mức. Tôi cũng không đồng ý với tuyên bố của bạn về kiến ​​thức tiên nghiệm. Một cái gì đó có vẻ hợp lý và biết rằng điều đó là hoàn toàn khác nhau. Tôi phải thừa nhận dường như có sự kháng cự trong các số liệu thống kê truyền thống đối với xác nhận chéo mà tôi chưa từng hiểu. Tôi sẽ chọn hiệu quả dự đoán trên dữ liệu mẫu hơn là thêm các giả định bất kỳ ngày nào.
Nir Friedman

2

Các lệnh Lasso dường như những gì bạn đang tìm kiếm: Nó tính toán các hệ số hồi quy regularized như trong tiêu chuẩn Lasso, nhưng tùy thuộc vào các hạn chế bổ sung mà. | β 1 | | β 2 | . . . | β j |β1 ...j|β1||β2|...|βj|

Điều này hoàn thành mục tiêu thứ hai là loại bỏ các hệ số cho độ trễ bậc cao hơn, nhưng hạn chế hơn so với hạn chế duy nhất là thích mô hình độ trễ thấp hơn. Và như những người khác chỉ ra, đây là một hạn chế nặng nề có thể rất khó để biện minh.

Sau khi phân phối, hãy trình bày kết quả của phương pháp trên cả dữ liệu chuỗi thời gian thực và mô phỏng, và các thuật toán chi tiết để tìm ra các hệ số. Kết luận đề cập đến một gói R, nhưng bài báo khá gần đây và một tìm kiếm trên CRAN cho "LASSO đã đặt hàng" xuất hiện trống rỗng, vì vậy tôi nghi ngờ gói này vẫn đang được phát triển.

Bài viết cũng đưa ra một cách tiếp cận khái quát, trong đó hai tham số chính quy "khuyến khích tính gần như đơn điệu". (Xem trang 6.) Nói cách khác, người ta sẽ có thể điều chỉnh các tham số để cho phép đặt hàng thoải mái. Đáng buồn thay, không có ví dụ cũng không so sánh của phương pháp thư giãn được cung cấp. Nhưng, các tác giả viết rằng việc thực hiện thay đổi này là một vấn đề đơn giản để thay thế một thuật toán này bằng một thuật toán khác, vì vậy người ta hy vọng nó sẽ là một phần của gói R sắp tới.


Cảm ơn, điều đó thực sự thú vị rằng đây là một ý tưởng gần đây. Tôi thực sự đã nảy ra ý tưởng tương tự khi thảo luận vấn đề với một người bạn khi tôi đặt câu hỏi 9 tháng trước, nhưng chưa bao giờ tìm hiểu sâu! Tôi chỉ cho rằng ý tưởng đó không phải là cuốn tiểu thuyết đó, hoặc người khác đã viết một bài báo về nó rồi.
anh chàng

Rất hoan nghênh! Tôi đã ngạc nhiên rằng nó là gần đây bản thân mình.
Sean Easter

1

Hình phạt LASSO lồng nhau ( pdf ) có thể được sử dụng nhưng không có gói R nào cho nó.


1
Hiện tại, đây là một nhận xét nhiều hơn là một câu trả lời. Bạn có thể mở rộng nó một chút, có lẽ bằng cách thảo luận về hình phạt LASSO lồng nhau, vv?
gung - Phục hồi Monica

0

Tôi biết bạn đã viết nó như một tiền đề, nhưng tôi sẽ không sử dụng LASSO được đặt hàng mà không hoàn toàn chắc chắn rằng đây là điều cần thiết, bởi vì các giả định của LASSO được đặt hàng không phù hợp trực tiếp với dự đoán theo chuỗi thời gian. Để làm ví dụ ngược lại, hãy xem xét trường hợp bạn có thời gian trễ là mười bước thời gian giữa phép đo và mục tiêu. Rõ ràng, các ràng buộc LASSO được đặt hàng không thể xử lý các hiệu ứng như vậy mà không quy kết vô nghĩa cho chín tham số đầu tiên.

λλλ= =0

λ


Tôi sẽ rõ ràng là không được quan tâm đến những hạn chế về trình tự của các hệ số nếu tôi không có mạnh mẽ a priori lý do để tin rằng nó. Đối với các mô hình mà tôi nghi ngờ là có khả năng, theo kinh nghiệm thì LASSO được đặt hàng sẽ hiệu quả hơn. Có hệ số trễ-10 với 9 khác là 0 không có ý nghĩa gì trong cài đặt thực chất của tôi . Đây là một vấn đề mà các đồng nghiệp của tôi đã giải quyết (thu hẹp dựa trên độ trễ), nhưng họ đã sử dụng các ý tưởng Bayesuan và vì vậy sẽ không xem xét LASSO (không thuộc Bayes).
anh chàng

Ok, bạn dường như biết những gì bạn làm. Nhưng hãy nhớ rằng LASSO được đặt hàng bị ràng buộc mạnh mẽ hơn so với tuyên bố "một lần không - luôn luôn bằng không" của bạn. Ngoài ra, bạn cũng có thể xem xét một mô hình trong đó các tham số nhập theo cách nhân. Sau đó, tầm quan trọng tương đối có thể tăng hoặc giảm cho đến khi hệ số trở thành số không.
davidhigh
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.