Độ mịn của lưới và quá mức khi điều chỉnh trong LASSO, sườn, lưới đàn hồi


8

tôi tự hỏi về

  • độ mịn lưới tối ưu và
  • mối quan hệ giữa độ mịn lưới và quá mức là gì

trong các phương pháp chính quy hóa như LASSO, hồi quy sườn hoặc lưới đàn hồi.

Giả sử tôi muốn điều chỉnh mô hình hồi quy bằng LASSO cho mẫu 500 quan sát (tôi không có dữ liệu; đây chỉ là một ví dụ). Giả sử tôi cũng có
(A) một lưới có 100 giá trị khác nhau trong phạm vi giữa và \ lambda_ {max} (B) một lưới có 1000 giá trị \ lambda khác nhau trong cùng một phạm vi, trong đó \ lambda là tham số kiểm soát mức độ xử phạt.λλminλmax
λλ
λ

Câu hỏi:

  1. Tôi có thể nói điều gì đó về xu hướng phù hợp hơn (A) so với (B) không?
  2. Tôi có thể xác định độ mịn lưới tối ưu? Làm sao?

Câu trả lời:


7

Tôi có thể nói điều gì đó về xu hướng phù hợp với (A) so với (B) không?

Với điều kiện là cả hai lưới bao phủ một phạm vi đủ, độ mịn của lưới không thực sự có liên quan đến việc quá mức trong vấn đề này (mặc dù lưới thô có thể không phù hợp nếu nó bỏ qua một khoảng có lợi). Không phải là nếu việc kiểm tra quá nhiều giá trị bằng cách nào đó sẽ thay đổi giao diện ngoài mẫu như thế nào. * Trong trường hợp các hồi quy bị phạt này, chúng tôi chắc chắn muốn tối ưu hóa chức năng khả năng bị phạt của mình đối với các giá trị , và nó không thành vấn đề nhiều giá trị của chúng tôi kiểm tra, vì hiệu năng ngoài mẫu cho một tập dữ liệu cố định và phân vùng cố định là hoàn toàn xác định. Hơn nữa, số liệu ngoài mẫu hoàn toàn không bị thay đổi bởi có bao nhiêu giá trịλλλbạn kiểm tra Lưới thô hơn có thể có nghĩa là bạn bỏ qua mức tối thiểu tuyệt đối trong số liệu ngoài mẫu của bạn, nhưng việc tìm mức tối thiểu tuyệt đối có thể không được mong muốn ở nơi đầu tiên bởi vì siêu âm có xu hướng được ước tính kém và các thuộc tính mẫu hữu hạn có nghĩa là dữ liệu các hạn chế sẽ là tiếng ồn nguồn trong ước tính đó sẽ lấn át những thay đổi nhỏ về khoảng cách giữa các điểm lưới liền kề: lỗi tiêu chuẩn của ước tính của bạn sẽ có xu hướng thay đổi độ mịn của lưới.

Nếu bạn thực sự lo ngại rằng số liệu hiệu suất ngoài mẫu có thể lạc quan quá mức, bạn có thể áp dụng quy tắc lỗi 1 tiêu chuẩn, chọn mô hình chính quy nhất trong phạm vi 1 lỗi tối thiểu. Theo cách đó, bạn sẽ hơi bảo thủ hơn và chọn một mô hình ít phức tạp hơn.

Tôi có thể xác định độ mịn lưới tối ưu? Làm sao?

Thuật toán LARS không một tiên nghiệm xác định những giá trị của để kiểm tra; thay vào đó, được thay đổi liên tục và thuật toán kiểm tra các giá trị của mà hệ số đi từ 0 đến giá trị khác không. Những giá trị củaλλλλtrong đó một hệ số mới là khác không được giữ lại, với quan sát rằng các đường dẫn hệ số là tuyến tính trong trường hợp của Lasso, do đó không mất thông tin khi chỉ lưu trữ các nút thắt trong trường hợp đó. LARS chỉ hoạt động khi đường dẫn hệ số là tuyến tính, mặc dù. Hình phạt sườn núi không bao giờ thu nhỏ một hệ số về 0 chính xác, vì vậy tất cả các đường dẫn hệ số của bạn đều trơn tru và luôn luôn khác không; tương tự hồi quy mạng đàn hồi (không bao gồm trường hợp hồi quy lưới đàn hồi cũng là hồi quy lasso).

Nhưng hầu hết mọi người sử dụng GLMNET vì nó thường nhanh hơn. Về mặt xác định lưới nào của để tìm kiếm, tôi khuyên bạn nên đọc bài viết GLMNET "Đường dẫn chính quy cho các mô hình tuyến tính tổng quát thông qua tọa độ gốc" của Jerome Friedman, Trevor Hastie và Rob Tibshirani. Trong đó, họ phát triển một thuật toán rất hiệu quả để ước tính các hồi quy lưới, lasso và đàn hồi. Thuật toán kiểm tra giá trị của mà là vectơ không và sau đó xác định giá trị tối thiểu liên quan đếnλ max beta λ phút λ maxλλmaxβλminλmax. Cuối cùng, họ tạo ra một chuỗi các giá trị giữa hai cái thống nhất trên thang đo log. Lưới này là đủ cho hầu hết các mục đích, mặc dù nó bỏ qua thuộc tính mà bạn sẽ biết chính xác khi một hệ số được ước tính ở một giá trị khác không. Khởi động ấm được sử dụng để cung cấp giải pháp nhanh hơn nhiều và nó hỗ trợ nhiều GLM phổ biến.


* Bạn có thể nghĩ về điều này từ góc độ của mạng nơ ron nhân tạo, trong đó việc dừng sớm đôi khi được sử dụng để thực hiện chính quy hóa, nhưng đó là một vấn đề hoàn toàn không liên quan (cụ thể là thuật toán tối ưu hóa được ngăn chặn để đạt đến mức tối ưu, vì vậy mô hình là buộc phải ít phức tạp hơn).


2
Tôi không nghĩ bạn hoàn toàn đúng trong mô tả về cách glmnet chọn người dùng lambdas777. Kiểm tra phần 2.5 trong bài báo, nơi họ thảo luận về việc lựa chọn lambda tối thiểu và tối đa, và những người ở giữa. Bạn có thể đang nghĩ về LARS, thực sự làm những gì bạn mô tả, nhưng tôi không tin rằng đã được khái quát hóa để bao gồm một hình phạt sườn núi.
Matthew Drury

@MatthewDrury Bah. Bạn đúng. Tôi đã nghĩ về LARS.
Sycorax nói phục hồi Monica

Tôi cũng đã đọc một số tài liệu liên quan và có lẽ bài báo đó cũng vậy, nhưng những điều sau đây không hoàn toàn thuyết phục đối với tôi: Cuối cùng, họ tạo ra một chuỗi các giá trị giữa hai đồng nhất trên thang đo log. Có một số biện minh cho thấy rằng đây là một lựa chọn tối ưu? Ngoài ra, làm thế nào để họ chọn độ mịn của lưới điện? Tôi không nhớ đã đọc một lời giải thích tốt.
Richard Hardy

1
Tôi đã quan sát thấy trong tất cả các sử dụng glmnet của mình rằng sự thay đổi khả năng nhật ký giữa các điểm lưới liên tiếp luôn bị chi phối bởi lỗi tiêu chuẩn ước tính của các ước tính nói trên. Vì vậy, lưới tiêu chuẩn đủ tốt để mọi thông tin thu được từ độ phân giải tăng sẽ bị chi phối bởi tính không chắc chắn trong ước tính lambda.
Matthew Drury

1
@amoeba Trường hợp kích thước mẫu nhỏ sẽ bị thay đổi bởi phương sai trong CV estiamtes: any trong vùng lân cận tối thiểu về cơ bản là giống nhau. Đây là lý do tại sao không có sự hoàn trả thực sự để tăng độ mịn lưới. Ngoài ra, các quỹ đạo thường là những đường cong đẹp, do đó, việc tăng độ mịn của lưới sẽ chỉ chiếm không gian giữa các estiamte. Trong các ví dụ tôi đã thấy, đường cong phản hồi không đột ngột lên xuống, đặc biệt là trong một khoảng thời gian tốt. λλλ
Sycorax nói Phục hồi Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.