Có một iter
tham số trong gensim
triển khai Word2Vec
class gensim.models.word2vec.Word2Vec (câu = Không, kích thước = 100, alpha = 0,025, window = 5, min_count = 5, max_vocab_size = Không, sample = 0, seed = 1, worker = 1, min_alpha = 0.0001, sg = 1, hs = 1, neg = 0, cbow_mean = 0, hashfxn =, iter = 1 , null_word = 0, trim_rule = Không, sort_vocab = 1)
chỉ định số lượng kỷ nguyên, nghĩa là:
iter = số lần lặp (epochs) trên kho văn bản.
Có ai biết liệu điều đó có giúp cải thiện mô hình trên kho văn bản không?
Có bất kỳ lý do tại sao iter
được đặt thành 1 theo mặc định? Không có nhiều tác dụng trong việc tăng không. kỷ nguyên?
Có bất kỳ đánh giá khoa học / thực nghiệm về cách đặt không. kỷ nguyên?
Không giống như nhiệm vụ phân loại / hồi quy, phương pháp tìm kiếm lưới sẽ không thực sự hoạt động do các vectơ được tạo theo cách không giám sát và hàm mục tiêu chỉ đơn giản bằng cách lấy mẫu mềm phân cấp hoặc lấy mẫu âm.
Có một cơ chế dừng sớm để cắt ngắn không. của kỷ nguyên một khi vectơ hội tụ? Và mục tiêu lấy mẫu mềm phân cấp hoặc tiêu cực có thể hội tụ?