Là hồi quy với chính quy hóa L1 giống như Lasso và với chính quy hóa L2 có giống như hồi quy sườn không? Và làm thế nào để viết được L LỊCH


33

Tôi là một kỹ sư phần mềm học máy học, đặc biệt thông qua các khóa học máy của Andrew Ng . Trong khi nghiên cứu hồi quy tuyến tính với chính quy , tôi đã tìm thấy các thuật ngữ khó hiểu:

  • Hồi quy với chuẩn hóa L1 hoặc chuẩn hóa L2
  • LASSO
  • Hồi quy sườn

Vì vậy, câu hỏi của tôi:

  1. Là hồi quy với chính quy hóa L1 giống hệt như LASSO?

  2. Là hồi quy với chính quy L2 chính xác giống như hồi quy Ridge?

  3. "LASSO" được sử dụng như thế nào trong văn bản? Nó có nên là "hồi quy LASSO" không? Tôi đã thấy cách sử dụng như " Lasso là phù hợp hơn ".

Nếu câu trả lời là "có" cho 1 và 2 ở trên, thì tại sao lại có các tên khác nhau cho hai thuật ngữ này? Có phải "L1" và "L2" đến từ khoa học máy tính / toán học và "LASSO" và "Sườn" từ các số liệu thống kê?

Việc sử dụng các thuật ngữ này gây nhầm lẫn khi tôi thấy các bài đăng như:

" Sự khác biệt giữa chuẩn hóa L1 và L2 là gì? " (Quora.com)

" Khi nào tôi nên sử dụng lasso vs sườn núi? " (Statistics.stackexchange.com)


Mặc dù tôi đang trả lời muộn. Hướng dẫn dành cho người mới bắt đầu toàn diện này về Hồi quy tuyến tính, sườn và Lasso sẽ giúp người mới bắt đầu hiểu rõ các thuật ngữ này. Xem tại đây
Học viên

Câu trả lời:


34
  1. Vâng.

  2. Vâng.

  3. LASSO thực sự là một từ viết tắt (toán tử co rút và lựa chọn tối thiểu tuyệt đối), do đó nó phải được viết hoa, nhưng chữ viết hiện đại là từ vựng tương đương với Mad Max . Mặt khác, Amoeba viết rằng ngay cả các nhà thống kê đã đặt ra thuật ngữ LASSO bây giờ cũng sử dụng kết xuất chữ thường (Hastie, Tibshirani và Wainwright, Học thống kê với Sparsity ). Người ta chỉ có thể suy đoán như là động lực cho việc chuyển đổi. Nếu bạn đang viết cho một báo chí học thuật, họ thường có một hướng dẫn phong cách cho loại điều này. Nếu bạn đang viết trên diễn đàn này, thì cũng tốt, và tôi nghi ngờ bất cứ ai thực sự quan tâm.

Các ký hiệu là một tham chiếu đến các chuẩn mực Minkowski và L p không gian. Những chỉ khái quát các khái niệm taxi và Euclide khoảng cách để p > 0 trong biểu thức sau đây: x p = ( | x 1 | p + | x 2 | p + . . . + | X n | p ) 1LLpp>0 Quan trọng hơn, chỉp1định nghĩa một khoảng cách số liệu; 0<p<1không thỏa mãn bất đẳng thức tam giác, do đó, nó không phải là khoảng cách theo hầu hết các định nghĩa.

xp= =(|x1|p+|x2|p+...+|xn|p)1p
p10<p<1

Tôi không chắc chắn khi kết nối giữa sườn núi và LASSO được thực hiện.

c


6
+1. Trong sách giáo khoa Thống kê với Sparsity gần đây , Hastie, Tibshirani và Wainwright sử dụng "lasso" chữ thường ở khắp mọi nơi và cũng viết như sau (chú thích trên trang 8): "Lasso là một sợi dây dài với một cái thòng lọng Cuối cùng, được sử dụng để bắt ngựa và gia súc. Theo nghĩa bóng, phương pháp của Lassos, các hệ số của mô hình. Trong bài báo gốc của Lasso (Tibshirani 1996), tên gọi lassoine cũng được giới thiệu như một từ viết tắt của Least tuyệt đối Nhà điều hành lựa chọn và thu hẹp. '"(CC to @ stackoverflowuser2010.)
amip nói rằng Tái lập lại Monica

3
Và họ tiếp tục: "Phát âm: trong tiếng Hoa và tiếng Anh có xu hướng được phát âm là Lass-oh, (trong tiếng dê), trong khi ở Vương quốc Anh lass-oo. Hồi trong OED (ấn bản 2, năm 1965): Lasso được phát âm bởi lasoo bởi những người sử dụng nó, và bởi hầu hết mọi người Anh cũng vậy. ""
amip nói rằng Rebstate Monica

4
(+1) Khi các từ viết tắt thích hợp (những từ viết tắt được phát âm là từ) đạt được tiền tệ, vốn hóa của chúng có xu hướng đi theo bảng. Lâu lắm rồi tôi mới thấy 'RADAR' hay 'LASER'.
Scortchi - Phục hồi Monica

2
@Scortchi SCUBA cũng vậy. Trong khi đó, chúng tôi có những người viết STATA và MATLAB như thể chúng là từ viết tắt.
Shadowtalker

2
@ssdecontrol: Có nên "ANOVA" là "AnOVa" không?
Scortchi - Phục hồi Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.