Ngoài các câu trả lời đã được đăng (rất hữu ích với tôi!), Có một lời giải thích hình học cho mối liên hệ giữa định mức L2 và giá trị trung bình.
Để sử dụng ký hiệu tương tự như Chefwen , công thức cho mất L2 là:
L 2 = 1kΣtôi =1k(ytôi-β)2
Chúng tôi muốn tìm giá trị của giúp giảm thiểu . Lưu ý rằng điều này tương đương với việc giảm thiểu các điều sau đây, vì nhân với và lấy căn bậc hai cả hai thứ tự bảo toàn:L 2 kβL 2k
Σi = 1k( ytôi- β)2----------⎷
Nếu bạn xem xét các vector dữ liệu như một điểm trong gian ba chiều, công thức này sẽ tính toán khoảng cách Euclide giữa điểm và điểm .ykyβ⃗ = ( β, β, . . . , β)
Vì vậy, vấn đề là tìm giá trị để giảm thiểu khoảng cách Euclide giữa các điểm và . Do các giá trị có thể có của đều nằm trên đường thẳng song song với theo định nghĩa, điều này tương đương với việc tìm phép chiếu vectơ của lên .βyβ⃗ β⃗ 1⃗ = ( 1 , 1 , . . . , 1 )y1⃗
Chỉ thực sự có thể hình dung điều này khi , nhưng đây là một ví dụ trong đó . Như được hiển thị, chiếu lên mang lại như chúng ta mong đợi.k = 2y= ( 2 , 6 )1⃗ ( 4 , 4 )
Để chỉ ra rằng phép chiếu này luôn mang lại giá trị trung bình (bao gồm cả khi ), chúng ta có thể áp dụng công thức cho phép chiếu :k > 2
β⃗ β= proj1⃗ y= = y⋅ 1⃗ | 1⃗ |21⃗ = ∑ki = 1ytôik