Tôi có nên bình thường hóa các vectơ từ của word2vec trước khi sử dụng chúng không?


38

Sau khi đào tạo các vectơ từ với word2vec, tốt hơn là bình thường hóa chúng trước khi sử dụng chúng cho một số ứng dụng tiếp theo? Tức là những ưu / nhược điểm của việc bình thường hóa chúng là gì?


trong một nhiệm vụ tương tự, chuẩn hóa đã cải thiện hiệu năng hệ thống của tôi một chút.
keramat

Câu trả lời:


30

Khi các ứng dụng xuôi dòng chỉ quan tâm đến hướng của vectơ từ (ví dụ: chúng chỉ chú ý đến độ tương tự cosin của hai từ), sau đó bình thường hóa và quên đi độ dài.

Tuy nhiên, nếu các ứng dụng xuôi dòng có thể (hoặc cần) xem xét các khía cạnh hợp lý hơn, chẳng hạn như tầm quan trọng của từ hoặc tính nhất quán trong việc sử dụng từ (xem bên dưới), thì việc chuẩn hóa có thể không phải là một ý tưởng hay.


Từ Levy và cộng sự, 2015 (và, trên thực tế, hầu hết các tài liệu về nhúng từ):

Các vectơ được chuẩn hóa theo chiều dài đơn vị trước khi chúng được sử dụng để tính toán độ tương tự, làm cho độ tương tự cosine và tương đương với sản phẩm chấm.

Cũng từ Wilson và Schakel, 2015 :

Hầu hết các ứng dụng của từ nhúng khám phá không phải bản thân các vectơ từ, mà là mối quan hệ giữa chúng để giải quyết, ví dụ, sự tương tự và các nhiệm vụ quan hệ từ. Đối với các tác vụ này, người ta thấy rằng sử dụng vectơ từ chuẩn hóa sẽ cải thiện hiệu suất. Do đó độ dài vectơ từ thường bị bỏ qua.

Bình thường hóa tương đương với việc mất khái niệm về chiều dài. Đó là, một khi bạn bình thường hóa các vectơ từ, bạn sẽ quên độ dài (định mức, mô-đun) mà họ có ngay sau giai đoạn đào tạo.

Tuy nhiên, đôi khi nó đáng để xem xét độ dài ban đầu của các vectơ từ.

Schakel và Wilson, 2015 quan sát một số sự thật thú vị liên quan đến độ dài của vectơ từ:

Một từ được sử dụng nhất quán trong một ngữ cảnh tương tự sẽ được biểu thị bằng một vectơ dài hơn một từ có cùng tần số được sử dụng trong các ngữ cảnh khác nhau.

Không chỉ hướng, mà cả chiều dài của vectơ từ mang thông tin quan trọng.

Chiều dài vectơ từ cung cấp, kết hợp với tần số hạn, một thước đo hữu ích của ý nghĩa từ.


Chúng ta có thể giải thích "người ta thấy rằng sử dụng vectơ từ chuẩn hóa sẽ cải thiện hiệu suất"? Không bình thường hóa bao gồm tính toán bổ sung?
thần kinh

4
@neurite, đó là bối cảnh, một hiệu suất tốt hơn đề cập đến một điểm số tốt hơn trong các nhiệm vụ đánh giá.
turdus-merula
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.