giải thích ý nghĩa và mục đích của chuẩn hóa L2


13

Hãy để tôi nói ngay từ đầu rằng tôi rất mới với máy học, và không giỏi toán. Tôi hiểu TF-IDF làm gì, nhưng trong cuốn sách tôi đang đọc, nó cũng ghi chú những điều sau đây (nó thảo luận về cách scikit-learn làm mọi thứ):

Cả hai lớp [TfidfTransformer và TfidfVectorizer] cũng áp dụng chuẩn hóa L2 sau khi tính toán biểu diễn tf-idf; nói cách khác, họ hủy bỏ việc biểu diễn của mỗi tài liệu để có chỉ tiêu Euclide 1. Thay đổi kích thước theo cách này có nghĩa là độ dài của tài liệu (số lượng từ) không thay đổi biểu diễn được vector hóa.

Đó là tất cả những gì nó phải nói về chủ đề này. Điều tôi nghĩ nó có nghĩa là gì, và cho tôi biết nếu tôi sai, là chúng tôi chia tỷ lệ các giá trị sao cho nếu chúng đều bình phương và tổng, giá trị sẽ là 1 (tôi lấy định nghĩa này từ http://kawahara.ca / how-to-normalize-vectors-to-unit-Norm-in-python / ).

Vì vậy, ý tưởng là các giá trị tính năng trở nên tương xứng với nhau. Tôi không hoàn toàn chắc chắn làm thế nào điều đó sẽ hữu ích cho mô hình, mặc dù. Nó có giúp trình phân loại tổng thể tìm hiểu nếu một số ví dụ không có tổng số "bật tính năng" cao hơn các tính năng khác không?

Ngoài ra, đây là một câu hỏi cơ bản: Chuẩn hóa L2 có liên quan đến việc chuẩn hóa L2 không? Có lẽ chỉ là cả hai đều liên quan đến các điều khoản bình phương và tổng kết?

Bất cứ cái nhìn sâu sắc nào bạn có thể chia sẻ, sẽ được đánh giá cao nhất!

Câu trả lời:


19

chúng tôi chia tỷ lệ các giá trị sao cho nếu tất cả chúng đều bình phương và tổng, giá trị sẽ là 1

Đúng rồi.

Tôi không hoàn toàn chắc chắn làm thế nào nó sẽ hữu ích cho mô hình, mặc dù

Hãy xem xét một trường hợp đơn giản hơn, trong đó chúng ta chỉ cần đếm số lần mỗi từ xuất hiện trong mỗi tài liệu. Trong trường hợp này, hai tài liệu có thể xuất hiện khác nhau đơn giản vì chúng có độ dài khác nhau (tài liệu dài hơn chứa nhiều từ hơn). Nhưng, chúng tôi quan tâm nhiều hơn đến ý nghĩa của tài liệu và độ dài không đóng góp cho việc này. Bình thường hóa cho phép chúng ta xem xét tần suất của các từ liên quan đến nhau, trong khi loại bỏ ảnh hưởng của tổng số từ.

Chuẩn hóa L2 có liên quan gì đến việc chuẩn hóa L2 không?

Chuẩn hóa L2 hoạt động dựa trên các tham số của mô hình, trong khi chuẩn hóa L2 (trong ngữ cảnh bạn hỏi về) hoạt động dựa trên biểu diễn dữ liệu. Chúng không liên quan theo bất kỳ ý nghĩa nào, ngoài thực tế là cả hai đều yêu cầu tính toán các chỉ tiêu L2 (tóm tắt các thuật ngữ bình phương, như bạn nói).

Nhưng, lưu ý rằng chuẩn hóa L2 là một hoạt động chung và có thể áp dụng trong các bối cảnh ngoài phạm vi bạn đang hỏi. Có những tình huống tồn tại trong đó người ta có thể rút ra mối liên hệ giữa hai khái niệm, nhưng tôi nghĩ điều đó vượt quá phạm vi của câu hỏi này.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.