Câu hỏi của tôi có thể là một câu ngớ ngẩn. Vì vậy tôi sẽ xin lỗi trước.
Tôi đã cố gắng sử dụng mô hình GLOVE được đào tạo trước bởi nhóm Stanford NLP ( liên kết ). Tuy nhiên, tôi nhận thấy rằng kết quả tương tự của tôi cho thấy một số số âm.
Điều đó ngay lập tức nhắc tôi xem tập tin dữ liệu từ-vector. Rõ ràng, các giá trị trong vectơ từ được phép âm. Điều đó giải thích tại sao tôi thấy sự tương đồng cosine tiêu cực.
Tôi đã quen với khái niệm tương tự cosine của các vectơ tần số, có giá trị được giới hạn trong [0, 1]. Tôi biết một thực tế rằng sản phẩm chấm và chức năng cosine có thể dương hoặc âm, tùy thuộc vào góc giữa vectơ. Nhưng tôi thực sự có một thời gian khó hiểu và giải thích sự tương tự cosin tiêu cực này.
Ví dụ: nếu tôi có một cặp từ có độ tương tự -0.1, thì chúng có ít giống nhau hơn so với cặp khác có độ tương tự là 0,05 không? Làm thế nào về việc so sánh độ tương tự của -0,9 đến 0,8?
Hay tôi chỉ nên nhìn vào giá trị tuyệt đối của chênh lệch góc tối thiểu từ ? Giá trị tuyệt đối của điểm số?
Rất rất cảm ơn.
An angular-type similarity coefficient between two vectors. It is like correlation, only without centering the vectors.
Sự khác biệt duy nhất giữa hai là ở độ lệch tương quan (khoảnh khắc) - đang được nhân chéo - là từ trung bình, trong khi ở độ lệch cosine là từ 0 ban đầu - nghĩa là chúng là các giá trị như chúng là .