Tôi muốn nói rằng các thuật toán word2vec dựa trên cả hai.
Khi mọi người nói distributional representation
, họ thường có nghĩa là khía cạnh ngôn ngữ: ý nghĩa là bối cảnh, biết từ của công ty và các trích dẫn nổi tiếng khác.
Nhưng khi mọi người nói distributed representation
, nó hầu như không liên quan gì đến ngôn ngữ học. Nó là nhiều hơn về khía cạnh khoa học máy tính. Nếu tôi hiểu Mikolov và các từ khác một cách chính xác, từ
distributed
trong bài báo của họ có nghĩa là mỗi thành phần duy nhất của biểu diễn vectơ không có bất kỳ ý nghĩa nào của riêng nó. Các tính năng có thể hiểu được (ví dụ: bối cảnh từ trong trường hợp word2vec) bị ẩn và distributed
trong số các thành phần vectơ không thể giải thích: mỗi thành phần chịu trách nhiệm cho một số tính năng có thể hiểu được và mỗi tính năng có thể hiểu được liên kết với một số thành phần.
Vì vậy, word2vec (và doc2vec) sử dụng các biểu diễn phân tán về mặt kỹ thuật, như một cách để biểu diễn ngữ nghĩa từ vựng. Và đồng thời, nó dựa trên khái niệm dựa trên giả thuyết phân phối: nó chỉ hoạt động vì giả thuyết phân phối là đúng (nghĩa của từ có tương quan với bối cảnh điển hình của chúng).
Nhưng tất nhiên thường là các thuật ngữ distributed
và distributional
được sử dụng thay thế cho nhau, làm tăng sự hiểu lầm :)