Phù hợp thường xuyên từ dữ liệu tóm tắt: chọn tham số


9

Theo câu hỏi trước đây của tôi , giải pháp cho các phương trình bình thường cho hồi quy sườn được đưa ra bởi:

β^λ=(XTX+λI)1XTy

Bạn có thể cung cấp bất kỳ hướng dẫn để chọn tham số chính quy . Ngoài ra, do đường chéo của phát triển với số lượng quan sát , nên cũng là một hàm của ?λXTXmλm

Câu trả lời:


7

Câu trả lời của tôi sẽ được dựa trên một đánh giá tốt về vấn đề bằng phương pháp hồi quy và các vấn đề nghịch đảo của Anders Bjorkstorm Ridge (tôi khuyên bạn nên đọc toàn bộ bài viết).

Phần 4 trong bài đánh giá này dành riêng cho việc lựa chọn tham số trong hồi quy sườn núi giới thiệu một số cách tiếp cận chính:λ

  1. dấu vết sườn núi tương ứng với phân tích đồ họa của so với . Một cốt truyện điển hình sẽ mô tả sự không ổn định (đối với một vấn đề không đúng sự thật, bạn phải chắc chắn rằng bạn cần sự chính quy này trong mọi trường hợp) các hành vi khác nhau của cho gần với không, và gần như không đổi từ một số điểm (đại khái là chúng ta phải phát hiện vùng giao nhau hành vi không đổi cho tất cả các tham số). Tuy nhiên, quyết định liên quan đến việc hành vi gần như không đổi này bắt đầu có phần chủ quan. Tin tốt cho phương pháp này là không cần phải quan sát và .β^i,λλβ^i,λλXy
  2. L -curve nó vẽ đồ thị định mức Euclide của vectơ các tham số ước tínhso với định mức còn lại. Hình dạng thường gần với chữ nên tồn tại một góc xác định vị trí của tham số tối ưu (người ta có thể chọn điểm trong đường cong nơi đường cong sau đạt đến độ cong tối đa , nhưng tốt hơn là tìm kiếm bài viết của Hansen để biết thêm chi tiết).|β^λ||yXβ^λ|LL
  3. Để xác thực chéo thực tế, phương pháp "bỏ qua một lần" đơn giản thường được chọn, tìm kiếm tối đa hóa (hoặc tối thiểu hóa) một số tiêu chí chính xác dự báo (bạn có phạm vi rộng trong số chúng, RMSE và MAPE là hai bắt đầu với). Khó khăn với 2. và 3. là bạn phải quan sát và để thực hiện chúng trong thực tế.λXy

3
Theo kinh nghiệm của tôi, bỏ qua một xác nhận chéo hầu như luôn luôn dẫn đến quá ít chính quy. xác thực chéo Fold gần như luôn luôn hoạt động tốt hơn. k
Đức hồng y

(+1) @cardinal, bổ sung hay, thành thật mà nói, tôi có ít kinh nghiệm với các phương pháp xác thực chéo. Những thứ đơn giản thông thường tôi sử dụng trong thực tế là dao jack (giảm đến quan sát tiếp theo) và ngoài mẫu cho dữ liệu chuỗi thời gian. Mặc dù Fold có thể được triển khai cho một số mô hình chuỗi thời gian, nhưng trước tiên phải thử nó để xây dựng trải nghiệm của riêng tôi. kk
Dmitrij Celov

Có một số phương pháp bootstrap khối đẹp cho chuỗi thời gian đứng yên. Có lẽ họ có thể hoặc đã được sửa đổi cho các mục đích chọn tham số chính quy.
Đức hồng y

Bạn có thể thấy bài báo sau hữu ích: Golub, GH; Heath, M. & Wahba, G. Xác thực chéo tổng quát như một phương pháp để chọn tham số độ dốc tốt. Kỹ thuật, 1979, 21, 215-223. Tiêu chí được giới thiệu bởi Golub et al. không yêu cầu lấy mẫu lại.
emakalic
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.