Làm cho danh tính của tác nhân trở thành một trong những tính năng và đào tạo trên tất cả dữ liệu. Có thể đào tạo một lô nhỏ gồm 128 đại lý cùng một lúc: chạy qua chuỗi thời gian từ đầu đến cuối cho 128 đại lý đó, sau đó chọn một lô đại lý nhỏ mới. Đối với mỗi lô nhỏ, hãy chạy một lát gồm 50 dấu thời gian, sau đó sao lưu. Giữ các trạng thái kết thúc từ lát cắt đó và chạy 50 dấu thời gian tiếp theo, bắt đầu từ các trạng thái kết thúc đó. Rửa sạch và lặp lại cho đến khi bạn kết thúc dấu thời gian, cho lô nhỏ đó gồm 128 đại lý.
Bằng cách đặt danh tính của từng tác nhân làm một trong các tính năng, bạn có thể tạo điều kiện cho mạng:
- học hỏi từ tất cả dữ liệu của bạn, từ đó tối đa hóa việc sử dụng dữ liệu của bạn và
- tìm hiểu các đặc điểm độc đáo của từng tác nhân, để nó không chỉ trung bình tất cả các tác nhân với nhau
- khi bạn dự đoán tương lai cho một tác nhân cụ thể, hãy đảm bảo sử dụng các tính năng id tác nhân tương ứng của chúng và mạng sẽ điều chỉnh dự đoán tương ứng.
Chỉnh sửa: Alpo Jose đã viết:
ok, tôi có cần sử dụng một mã hóa nóng để tạo danh tính của đại lý không?
Ồ, đó là sự thật. Có 20.000 người trong số họ. Đó là loại rất nhiều. Tôi nghĩ rằng những gì bạn có thể muốn làm là 'nhúng' chúng. Có một lớp tra cứu, lấy một id tác nhân (được biểu thị dưới dạng một số nguyên, một chỉ mục) và xuất ra một vectơ có chiều cao, giống như một vectơ có chiều dài 50-300, có thể là một vectơ có chiều dài xấp xỉ với kích thước ẩn của LSTM của bạn.
Về mặt toán học, một bảng tra cứu, còn được gọi là 'lớp nhúng', tương đương với việc biến các id tác nhân thành các vectơ một nóng, sau đó đi qua một lớp tuyến tính (được kết nối đầy đủ). Tuy nhiên, các yêu cầu trong bộ nhớ được giảm nhiều cho lớp nhúng.
Về những gì lớp nhúng sẽ học, khi bạn huấn luyện nó, lớp nhúng sẽ tạo thành một loại đại diện tiềm ẩn của mỗi tác nhân. Đại diện tiềm ẩn sẽ có thể đọc được / có thể hiểu được bằng bất kỳ cách nào, nhưng sẽ cho phép mô hình học những thứ như 'ok tác nhân này, 1524, tương đối hiệu quả, nhưng không phải vào cuối tuần; nơi 1526 là tuyệt vời mỗi ngày; Vân vân ....'. Kích thước tiềm ẩn của vectơ nhúng có thể thực sự có nghĩa là công cụ, nhưng không ai từng cố gắng tìm hiểu ý nghĩa của chúng (tôi nghĩ rằng điều đó sẽ khó / không thể). Tuy nhiên, các nhúng nhúng trên mỗi tác nhân chiều cao cho phép mô hình tìm hiểu điều gì đó về hành vi của từng tác nhân và mô hình hóa điều này trong các dự đoán chuỗi thời gian.