Làm thế nào để mô hình bỏ qua gram của Word2Vec tạo ra các vectơ đầu ra?


11

Tôi gặp vấn đề trong việc hiểu mô hình bỏ qua của thuật toán Word2Vec.

Trong các từ liên tục có thể dễ dàng thấy các từ ngữ cảnh có thể "khớp" trong Mạng thần kinh như thế nào, vì về cơ bản, bạn trung bình chúng sau khi nhân từng biểu diễn mã hóa một nóng với ma trận đầu vào W.

Tuy nhiên, trong trường hợp bỏ qua gram, bạn chỉ nhận được vectơ từ đầu vào bằng cách nhân mã hóa một nóng với ma trận đầu vào và sau đó bạn có thể lấy các biểu diễn vectơ C (= kích thước cửa sổ) cho các từ ngữ cảnh bằng cách nhân biểu diễn vectơ đầu vào với ma trận đầu ra W '.

Những gì tôi có nghĩa là, có một vốn từ vựng của kích thước và mã hóa kích thước N , W R V × N ma trận đầu vào và W 'R N × V là ma trận đầu ra. Cho từ w i với mã hóa một nóng x i với các từ ngữ cảnh w jw h (với đại diện một nóng x jx h ), nếu bạn nhân x i với ma trận đầu vào W bạn nhận được h :VNWRV×NWRN×VwixiwjwhxjxhxiW , bây giờ làm thế nào để bạn tạo ra C vectơ điểm từ này?h:=xiTW=W(i,)RNC

Câu trả lời:


7

Tôi đã có cùng một vấn đề hiểu nó. Có vẻ như vectơ điểm đầu ra sẽ giống nhau cho tất cả các thuật ngữ C. Nhưng sự khác biệt về lỗi với mỗi vectơ đại diện một nóng sẽ khác nhau. Do đó, các vectơ lỗi được sử dụng trong lan truyền ngược để cập nhật các trọng số.

Nêu tôi sai vui long chân chỉnh tôi.

nguồn: https://iksinc.wordpress.com/tag/skip-gram-model/


nên ? WRN×(VC)
Fabich

0

Trong cả hai điểm số đầu ra của mô hình phụ thuộc vào chức năng điểm số mà bạn sử dụng. Có thể có hai chức năng điểm số softmax hoặc lấy mẫu âm tính. Vì vậy, bạn sử dụng một chức năng điểm số softmax. Bạn sẽ nhận được kích thước chức năng điểm của N * D. Ở đây D là kích thước của một vectơ từ. N là số ví dụ. Mỗi từ giống như một lớp trong kiến ​​trúc mạng thần kinh.


0

kthkth

Điểm cho mỗi từ được tính theo phương trình sau.

u=WTh

Wu CC

p(wc,j=wO,c|wI)=expuc,jj=1Vexpuj

C

uC

References:

  • Xin Rong, Word2Vec Tham số học tập Giải thích

Vậy ma trận W thực chất là các vectơ từ (đầu ra của thuật toán) và W 'là một ma trận hoàn toàn khác mà chúng ta vứt bỏ?
Nadav B

W 'cũng là các vectơ từ cũng tốt như nhau.
3108764

1
p(wc,j=wO,c|wI)=expuc,jj=1Vexpuj=expujj=1Vexpuj
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.