Phương pháp LASSO / LARS so với phương pháp chung (cụ thể)


15

Tôi đã tự hỏi, tại sao các phương pháp lựa chọn mô hình LASSO và LARS lại phổ biến như vậy mặc dù về cơ bản chúng chỉ là các biến thể của lựa chọn chuyển tiếp theo bước (và do đó bị phụ thuộc vào đường dẫn)?

Tương tự, tại sao các phương thức General to Cụ thể (GETS) cho lựa chọn mô hình hầu hết bị bỏ qua, mặc dù chúng làm tốt hơn LARS / LASSO vì chúng không gặp phải vấn đề hồi quy từng bước? (tham khảo cơ bản cho GETS: http://www.federalreserve.gov/pub/ifdp/2005/838/ifdp838.pdf - thuật toán mới trong này bắt đầu với một mô hình rộng và tìm kiếm cây tránh sự phụ thuộc đường dẫn và đã được hiển thị thường làm tốt hơn LASSO / LARS).

Có vẻ lạ, LARS / LASSO dường như được tiếp xúc và trích dẫn nhiều hơn so với Chung đến Cụ thể (GETS), có ai có suy nghĩ gì không?

Không cố gắng để bắt đầu một cuộc tranh luận sôi nổi, tìm kiếm một lời giải thích hợp lý cho lý do tại sao văn học dường như tập trung vào LASSO / LARS thay vì GETS và rất ít người thực sự chỉ ra những thiếu sót của LASSO / LARS.


Bạn có ý nghĩa gì bởi con đường phụ thuộc ở đây? Ngoài ra, có một số tài liệu tham khảo có thẩm quyền hơn mà bạn có thể cung cấp cho GETS? Tôi không quen thuộc với điều này.
Đức hồng y

Dưới đây là một tài liệu tham khảo tốt hơn, "có thẩm quyền" hơn cũng đề cập đến Lasso: degruyter.com/view/j/jtse.2011.3.1/jtse.2011.3.1.1097/ .
tortilla

Ý tôi cũng muốn nói thêm: vì vậy, bạn thêm từng biến hồi quy đáng kể, nhưng cách tiếp cận này không cho phép bạn bỏ qua nếu dựa trên mối tương quan giữa các biến hồi quy có thể trở nên không đáng kể. Do đó, một khi được thêm vào, có sự phụ thuộc đường dẫn mà bộ hồi quy này được thiết lập và không thể bỏ được. Không phải vậy sao?
tortilla

1
Các biến có thể bị rơi giữa chừng bởi Lasso nếu đường hệ số của nó vượt qua 0 trên đường đi. Bạn có quen thuộc với Efron et al. bài viết gốc về LARS? Nó giải thích điều này một cách chi tiết với hương vị hình học đẹp.
Đức hồng y

2
Tôi nghĩ rằng Lasso là phổ biến vì nó thực hiện lại một cách hiệu quả vấn đề lựa chọn mô hình từ một trong những thử nghiệm giả thuyết đến một ước tính tham số.
xác suất

Câu trả lời:


2

Tuyên bố miễn trừ trách nhiệm: Tôi chỉ quen thuộc từ xa với công việc lựa chọn mô hình của David F. Hendry trong số những người khác. Tuy nhiên, tôi biết từ các đồng nghiệp đáng kính rằng Hendry đã đạt được tiến bộ rất thú vị về các vấn đề lựa chọn mô hình trong kinh tế lượng. Để đánh giá liệu các tài liệu thống kê không chú ý đầy đủ đến công việc của ông về lựa chọn mô hình sẽ đòi hỏi nhiều công việc hơn cho phần của tôi.

Tuy nhiên, thật thú vị khi cố gắng hiểu tại sao một phương pháp hoặc ý tưởng tạo ra nhiều hoạt động hơn các phương pháp khác. Không có nghi ngờ rằng có những khía cạnh của thời trang trong khoa học quá. Như tôi thấy, lasso (và bạn bè) có một lợi thế lớn là giải pháp cho một vấn đề tối ưu hóa rất dễ thể hiện. Đây là chìa khóa cho sự hiểu biết lý thuyết chi tiết về giải pháp và các thuật toán hiệu quả được phát triển. Cuốn sách gần đây, Thống kê dữ liệu chiều cao của Bühlmann và Van De Geer, minh họa mức độ đã biết về Lasso.

Tất nhiên, bạn có thể thực hiện các nghiên cứu mô phỏng vô tận và dĩ nhiên, bạn có thể áp dụng các phương pháp bạn thấy phù hợp nhất và phù hợp cho một ứng dụng cụ thể, nhưng đối với các phần của tài liệu thống kê cũng phải thu được kết quả lý thuyết đáng kể. Lasso đó đã tạo ra rất nhiều hoạt động phản ánh rằng có những câu hỏi lý thuyết thực sự có thể được tiếp cận và họ có những giải pháp thú vị.

Điểm khác là Lasso hoặc các biến thể làm việc tốt trong nhiều trường hợp. Tôi chỉ đơn giản là không tin rằng chính xác là Lasso rất dễ vượt trội hơn các phương pháp khác như OP gợi ý. Có thể về mặt lựa chọn mô hình (nhân tạo) nhưng không phải về mặt hiệu suất dự đoán. Không có tài liệu tham khảo nào được đề cập dường như thực sự so sánh Gets và Lasso.


2

tại sao các phương pháp lựa chọn mô hình LASSO và LARS lại phổ biến như vậy mặc dù về cơ bản chúng chỉ là các biến thể của lựa chọn chuyển tiếp theo bước khôn ngoan

Có một sự khác biệt giữa lựa chọn tập hợp con LASSO và (GETS): LASSO thu nhỏ các hệ số về 0 theo cách phụ thuộc dữ liệu trong khi lựa chọn tập hợp con (GETS) thì không. Đây dường như là một lợi thế của lựa chọn tập hợp con LASSO so với (GETS), ngay cả khi đôi khi nó có thể thất bại (nó cần điều chỉnh tham số, thường được thực hiện thông qua xác thực chéo và đôi khi chúng ta có thể điều chỉnh kém).

(GETS) phương thức <...> làm tốt hơn LARS / LASSO

Hiệu suất của GETS dường như có chất lượng tương đương với LASSO khi được thực hiện bởi các nhà nghiên cứu vô tư (?) (Mặc dù không nhất thiết phải như vậy trong các bài báo đề xuất phiên bản mới của GETS - nhưng đó là những gì bạn mong đợi); xem một số tài liệu tham khảo trong chủ đề này .

Có lẽ Sir Hendry & Co đang thu được kết quả tốt khi sử dụng GETS do các chi tiết cụ thể của ứng dụng của họ (chủ yếu là mô hình chuỗi thời gian kinh tế vĩ mô)? Nhưng tại sao có thể như vậy? Đây là một câu hỏi riêng biệt .

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.