Nhưng đây không phải là những gì chúng ta muốn. Ý tôi là nó cứu chúng ta khỏi những rắc rối của đa cộng đồng phải không.
Đúng! và không. Lưới đàn hồi là sự kết hợp của hai kỹ thuật chính quy hóa, chính quy L2 (được sử dụng trong hồi quy sườn) và chính quy L1 (được sử dụng trong LASSO).
Lasso tạo ra các mô hình thưa thớt tự nhiên, tức là hầu hết các hệ số biến đổi sẽ được thu nhỏ về 0 và loại trừ khỏi mô hình một cách hiệu quả. Vì vậy, các biến ít quan trọng nhất được thu nhỏ lại, trước khi thu nhỏ các biến khác, không giống như sườn núi, nơi tất cả các biến được thu nhỏ, trong khi không có biến nào thực sự bị thu hẹp về 0.
Lưới đàn hồi sử dụng kết hợp tuyến tính của cả hai phương pháp này. Trường hợp cụ thể được đề cập bởi Hastie khi thảo luận về phương pháp này là trong trường hợp p lớn, n nhỏ. Có nghĩa là: dữ liệu chiều cao với, tương đối ít quan sát. Trong trường hợp này, LASSO sẽ (chỉ báo cáo) chỉ chọn tối đa n biến, trong khi loại bỏ tất cả các biến còn lại, xem bài báo của Hastie .
Nó sẽ luôn phụ thuộc vào tập dữ liệu thực tế, nhưng bạn cũng có thể tưởng tượng rằng bạn không luôn muốn có giới hạn trên về số lượng biến trong các mô hình của mình bằng hoặc thấp hơn số lượng quan sát của bạn.