Norms - Điều gì đặc biệt về


13

Một chỉ tiêu L1 là duy nhất (ít nhất là một phần) vì p=1 nằm ở ranh giới giữa không lồi và lồi. Một chỉ tiêu L1 là chỉ tiêu lồi 'thưa thớt nhất' (phải không?).

Tôi hiểu rằng chỉ tiêu Euclide p=2 có nguồn gốc từ hình học và nó có một sự giải thích rõ ràng khi các kích thước có cùng đơn vị. Nhưng tôi không hiểu tại sao nó được sử dụng tốt hơn các số thực khác p>1 : p=1.5 ? p=π ? Tại sao không sử dụng phạm vi liên tục đầy đủ như một siêu tham số?

Tôi đang thiếu gì?


1
"Được sử dụng ưu tiên" trong các ứng dụng, cụ thể là gì? Các tiêu chuẩn có mặt khắp nơi trong toán học, thống kê và vật lý; trong một số trường con, một số chỉ tiêu phổ biến hơn các trường khác bởi vì chúng có ý nghĩa hơn hoặc đơn giản hơn để làm việc với. Vì lý do này, câu trả lời cho câu hỏi này có thể sẽ rất nhiều và đa dạng (rất đa dạng, thực sự, cá nhân tôi thấy điều này không thể trả lời được). Do đó, tôi đã đặt đây là một bài đăng "Wiki cộng đồng" (CW); nhưng nếu bạn có một ứng dụng cụ thể hoặc lĩnh vực hẹp trong tâm trí, thì bằng cách làm cho câu hỏi của bạn chính xác hơn, bạn có thể xóa trạng thái CW.
whuber

Câu trả lời:


12

Một giải thích toán học hơn là không gian , bao gồm tất cả các chuỗi hội tụ theo chỉ tiêu p, chỉ có Hilbert với p = 2 và không có giá trị nào khác. Điều này có nghĩa là không gian này đã hoàn tất và định mức trên không gian đó có thể được tạo ra bởi một sản phẩm bên trong (nghĩ về sản phẩm chấm quen thuộc trong R n ), do đó, nó sẽ hoạt động tốt hơn một chút.lpp=2Rn


4

Dưới đây là một vài lý do:

  1. Nó liên quan theo một cách rất đặc biệt đến sản phẩm bên trong: đó là quy tắc kép của riêng nó (tức là "tự kép").
    Điều này có nghĩa là, nếu bạn xem xét tất cả các vectơ bên trong bóng đơn vị , sản phẩm bên trong tối đa của chúng với bất kỳ vectơ z nào là định mức 2 của chính z . Ít huyền ảo hơn, nó thỏa mãn tính chất x 2 2 = x x2z2zx22=xx . Không khác chuẩn mực hành xử theo cách này.p

  2. Nó có một rất dốc thuận tiện mịn: Bạn thực sự không thể đánh bại đó!

    x f(x)22=2 f(x)f(x)

2

Mặc dù có thể có nhiều lý do hơn nhưng AFAIK p = 2 được ưa thích vì các lý do sau:

  • Đo lường mức độ tương đồng / khác biệt: Với p = 2, chỉ tiêu Euclide đưa ra thước đo về sự tương đồng hoặc khác biệt giữa hai vectơ mà sau đó có thể được sử dụng để hiểu rõ hơn về dữ liệu. Câu trả lời chi tiết hơn về điều này có thể được tìm thấy ở đây .
  • Chính quy hóa: Định mức L2 được sử dụng để chính quy hóa trong học máy và được ưa thích vì hai lý do- 1) Dễ dàng phân biệt 2) Với chính quy L2, các trọng số có xu hướng giảm tỷ lệ thuận với các trọng số. Do đó, chính quy L2 xử phạt các trọng số lớn hơn nhiều so với các trọng số nhỏ hơn.

1

Lỗi bình phương trong các mô hình tuyến tính thường được ưa thích vì:

  • mối quan hệ với tính trực giao, hành xử tốt đối với một số hiện tượng ngẫu nhiên được coi là tiếng ồn (không tương quan)
  • nó lồi và khác biệt, không phải L1
  • nó mang lại các thuật toán tối ưu hóa có thể điều khiển được khi đạo hàm biến thành các hệ tuyến tính

thường được xem như là một proxy thuận tiện hoặc thư giãn lồi đến thưa thớt nghiêm ngặt (tính của khác không điều kiện) được combinatorially phức tạp, xem ví dụĐối với hầu hết các hệ Underdetermined lớn của phương trình tuyến tính các Minimal1 -norm Giải pháp cũng là Giải pháp thưa thớt nhất. Một số xu hướng sử dụngp , 0 < p < 1L11p0<p<1 để thực thi độ thưa thớt hơn, với chi phí "mất" lồi.

000p1p0p0 , sự khác biệt này dường như là một khoảng cách với tôi.

1/21/2

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.