Gần đây tôi đã xem xét một triển khai thú vị để phân loại văn bản phức hợp . Tuy nhiên, tất cả mã TensorFlow mà tôi đã xem xét sử dụng vectơ nhúng ngẫu nhiên (không được đào tạo trước) như sau:
with tf.device('/cpu:0'), tf.name_scope("embedding"):
W = tf.Variable(
tf.random_uniform([vocab_size, embedding_size], -1.0, 1.0),
name="W")
self.embedded_chars = tf.nn.embedding_lookup(W, self.input_x)
self.embedded_chars_expanded = tf.expand_dims(self.embedded_chars, -1)
Có ai biết cách sử dụng kết quả của Word2vec hoặc nhúng từ được đào tạo trước GloVe thay vì một kết quả ngẫu nhiên không?