Không chắc chắn nếu đây là trang web ngăn xếp đúng, nhưng ở đây đi.
Phương thức .simustomity hoạt động như thế nào?
Wow spaCy thật tuyệt! Mô hình tfidf của nó có thể dễ dàng hơn, nhưng w2v chỉ với một dòng mã?!
Trong bài hướng dẫn 10 dòng của mình về spaCy andrazhackernik cho chúng tôi thấy phương pháp .similarity có thể chạy trên mã thông báo, sents, chunk từ và tài liệu.
Sau nlp = spacy.load('en')
và doc = nlp(raw_text)
chúng ta có thể thực hiện các truy vấn .similarity giữa các mã thông báo và khối. Tuy nhiên, những gì đang được tính toán đằng sau hậu trường trong .similarity
phương pháp này ?
SpaCy đã có một công cụ cực kỳ đơn giản .vector
, tính toán vectơ w2v như được đào tạo từ mô hình GloVe (một phương pháp .tfidf
hoặc .fasttext
phương pháp sẽ tuyệt vời như thế nào ?).
Là mô hình đơn giản tính toán sự tương tự cosine giữa hai w2v, .vector, vectơ hoặc so sánh một số ma trận khác? Các chi tiết cụ thể không rõ ràng trong tài liệu ; Bất kỳ trợ giúp đánh giá cao!