Tôi đã nhận được từ các bài đăng khác rằng người ta không thể gán thuộc tính 'tầm quan trọng' hoặc 'tầm quan trọng' cho các biến dự đoán nhập vào mô hình Lasso vì việc tính giá trị p của các biến đó hoặc độ lệch chuẩn vẫn đang được tiến hành.
Theo lý luận đó, có đúng không khi khẳng định rằng một người KHÔNG THỂ nói rằng các biến được LOẠI từ mô hình Lasso là 'không liên quan' hay 'không đáng kể'?
Nếu vậy, tôi thực sự có thể yêu cầu gì về các biến bị loại trừ hoặc được bao gồm trong mô hình Lasso? Trong trường hợp cụ thể của tôi, tôi đã chọn tham số điều chỉnh lambda bằng cách lặp lại xác thực chéo 10 lần 100 lần để giảm randonmess và để tính trung bình các đường cong lỗi.
CẬP NHẬT1: Tôi đã làm theo một gợi ý bên dưới và chạy lại Lasso bằng các mẫu bootstrap. Tôi đã thực hiện với 100 mẫu (số tiền đó là năng lượng máy tính của tôi có thể quản lý qua đêm) và một số mẫu đã xuất hiện. 2 trong số 41 biến của tôi đã nhập mô hình hơn 95% lần, 3 biến hơn 90% và 5 biến hơn 85%. 5 biến đó nằm trong số 9 biến được nhập vào mô hình khi tôi chạy nó với mẫu ban đầu và là biến có giá trị hệ số cao nhất sau đó. Nếu tôi chạy lasso với 1000 mẫu bootstrap và các mẫu đó được duy trì, cách tốt nhất để trình bày kết quả của tôi là gì?
1000 mẫu bootstrap có đủ âm thanh không? (Cỡ mẫu của tôi là 116)
Tôi có nên liệt kê tất cả các biến và tần suất chúng nhập vào mô hình, và sau đó lập luận rằng những biến nhập thường xuyên hơn có nhiều khả năng là đáng kể?
Đó có phải là xa như tôi có thể đi với yêu cầu của tôi? Bởi vì đó là một công việc đang tiến hành (xem ở trên) tôi không thể sử dụng giá trị giới hạn, phải không?
CẬP NHẬT2: Theo một gợi ý dưới đây, tôi đã tính như sau: trung bình, 78% các biến trong mô hình ban đầu đã nhập các mô hình được tạo cho 100 mẫu bootstrap. Mặt khác, chỉ có 41% cho cách khác. Điều này phải làm rất nhiều với thực tế là các mô hình được tạo cho các mẫu bootstrap có xu hướng bao gồm nhiều biến số hơn (trung bình 17) so với mô hình ban đầu (9).
CẬP NHẬT3: Nếu bạn có thể giúp tôi diễn giải các kết quả tôi nhận được từ bootstrapping và mô phỏng Monte Carlo, vui lòng xem qua bài đăng khác này .