Trong cài đặt nào bạn muốn mô hình được tìm thấy bởi LARS khác với hầu hết mô hình được tìm thấy bởi tìm kiếm toàn diện?


9

Thêm một chút thông tin; giả sử rằng

  1. bạn biết trước có bao nhiêu biến để chọn và bạn đặt hình phạt phức tạp trong thủ tục LARS để có chính xác có bao nhiêu biến có hệ số không 0,
  2. chi phí tính toán không phải là một vấn đề (tổng số biến là nhỏ, giả sử 50),
  3. rằng tất cả các biến (y, x) là liên tục.

Trong cài đặt nào, mô hình LARS (nghĩa là độ khớp OLS của các biến đó có hệ số khác không trong độ khớp LARS) sẽ khác biệt nhất với mô hình có cùng số hệ số nhưng được tìm thấy thông qua tìm kiếm toàn diện (a la regsubets ())?

Chỉnh sửa: Tôi đang sử dụng 50 biến và 250 quan sát với các hệ số thực được rút ra từ một gaussian tiêu chuẩn ngoại trừ 10 biến có hệ số 'thực' là 0 (và tất cả các tính năng có tương quan mạnh với nhau). Các cài đặt này rõ ràng là không tốt vì sự khác biệt giữa hai bộ biến được chọn là phút. Đây thực sự là một câu hỏi về loại cấu hình dữ liệu nào nên mô phỏng để có được sự khác biệt nhất.

Câu trả lời:


1

Dưới đây là mô tả về thuật toán LARS: http://www-stat.stanford.edu/~tibs/lasso/simple.html Nó bỏ qua mối tương quan giữa các biến hồi quy nên tôi sẽ mạo hiểm đoán rằng nó có thể bỏ lỡ sự phù hợp trong trường hợp đa hình.


đó là những gì thúc đẩy câu hỏi của tôi thực sự. Tôi đã mô phỏng các cài đặt với 50 biến trong đó giá trị lớn nhất của vif vượt quá 30 và tôi vẫn thấy rất ít sự khác biệt (ví dụ về R ^ 2 của các mô hình đã chọn) giữa hai cách tiếp cận.
user603

1
Bản thân tôi đã tìm thấy các câu trả lời khác nhau với stepAIC và lars và sẽ tưởng tượng rằng vấn đề của tôi là được xử lý với nhóm LASSO - đó không phải là về VIF của toàn bộ ma trận, mà là một số cụm biến tương quan.
Alex

Can thiệp ... làm thế nào để bạn tạo ra dữ liệu đó? (tức là với các cụm biến tương quan)
user603

Xếp chồng một số nhóm độc lập với mối tương quan bên trong chúng. Bản thân tôi có một loạt các câu hỏi tương tự được hỏi về một số thương hiệu - mọi người có xu hướng thích thương hiệu mà họ lựa chọn và không thích người khác.
Alex

3

Bạn càng có nhiều tính năng, liên quan đến số lượng mẫu, bạn càng có nhiều khả năng phù hợp với phương pháp tìm kiếm vượt trội so với LARS. Thuật ngữ hình phạt được sử dụng trong LARS áp đặt cấu trúc lồng nhau của các mô hình ngày càng phức tạp, được lập chỉ mục bởi một tham số chính quy duy nhất, do đó "mức độ tự do" của lựa chọn tính năng với LARS là khá thấp. Đối với tìm kiếm exaustive, có một mức độ tự do (nhị phân) cho mỗi tính năng, có nghĩa là tìm kiếm exaustive có thể khai thác tốt hơn sự thay đổi ngẫu nhiên trong tiêu chí lựa chọn tính năng do lấy mẫu ngẫu nhiên của dữ liệu. Do đó, mô hình tìm kiếm vượt trội có thể sẽ được trang bị phù hợp với tiêu chí lựa chọn tính năng, vì "lớp giả thuyết" lớn hơn.


Câu trả lời của bạn dường như không liên quan đến câu hỏi của tôi. Để làm rõ: Tôi thực sự quan tâm đến việc tạo ra các tình huống trong đó tập hợp con của các biến được chọn bởi LARS sẽ khác với các biến được chọn bởi tìm kiếm toàn diện, với điều này được đo bằng, giả sử, sự khác biệt về R ^ 2 giữa mô hình LARS và mô hình tìm kiếm toàn diện với cùng một số biến hoạt động . Bạn có thể nghĩ về bất kỳ trường hợp bất lợi nào mà sự khác biệt này sẽ lớn không? Bạn có thể diễn đạt lại câu trả lời của bạn trong các điều khoản này?
user603

3
Câu trả lời của tôi liên quan trực tiếp đến câu hỏi của bạn. Mức độ phù hợp không chỉ được kiểm soát bởi số lượng tính năng, mà bởi các giá trị của trọng số. Do đó, có thể phù hợp quá mức mà không cần sử dụng nhiều tính năng. LARS đưa ra một hình phạt về độ lớn của các trọng số, vì vậy nó không chọn các tính năng chỉ làm giảm tổn thất bình phương với chi phí của các trọng số lớn, đó là lý do tại sao nó ít bị khớp quá mức. Các phương pháp tìm kiếm vượt trội về cơ bản là một công thức cho sự phù hợp quá mức, vì vậy bạn sẽ nhận được các giải pháp rất khác nhau trong các tình huống có thể xảy ra sự phù hợp quá mức.
Dikran Marsupial

Ok, tôi hiểu ý của bạn: nó xuất phát từ một cái gì đó tôi nêu ra trong câu hỏi ban đầu của tôi (và hy vọng được làm rõ hơn bây giờ). Tôi thực sự so sánh táo với táo ở đây (tức là các mô hình đã chọn), hay nói cách khác, (R ^ 2 trong số) OLS phù hợp bằng cách sử dụng các biến được chọn bởi LARS và (R ^ 2 trong số) OLS phù hợp sử dụng các biến đó các biến được chọn bởi tìm kiếm toàn diện. Tôi không trực tiếp sử dụng các hệ số LARS ....
user603

3
Nó không trực giao, một mô hình không chắc là tốt hơn mô hình khác mà không khác biệt. Trong các tình huống có khả năng phù hợp quá mức, một mô hình dựa trên tìm kiếm quá mức có thể không ổn định, tức là nếu bạn thu thập được 500 mẫu khác nhau, bạn có thể nhận được một bộ tính năng khác. Mặt khác, LARS có vẻ ổn định hơn. Việc 50 tính năng và 500 mẫu có giống như kết quả của việc quá mức hay không phụ thuộc vào bản chất của bộ dữ liệu, nhưng chắc chắn là có thể. Tìm kiếm toàn diện có thể chọn các tính năng giải thích tính đặc thù của mẫu này; LARS ít như vậy.
Dikran Marsupial

2
Nó có thể giúp nếu bạn có thể giải thích lý do tại sao bạn muốn làm điều đó. Tôi nghi ngờ điều bạn cần xem xét là độ lớn của trọng số của mô hình thực cũng như phân phối dữ liệu. Các mô hình hồi quy hình phạt (LASSO, LARS, Elaris net, hồi quy sườn) có trước phân phối trọng số dự kiến, vì vậy nếu bạn có một tập dữ liệu không hợp lệ, đó có thể là một nơi tốt để bắt đầu.
Dikran Marsupial
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.