Tôi đang xây dựng một mạng lưới thần kinh để dự đoán giá trị của một tác phẩm nghệ thuật với nhiều loại đầu vào (kích thước, phương tiện nghệ thuật, v.v.) và tôi cũng muốn đưa tác giả làm đầu vào (nó thường rất lớn yếu tố giá trị của một tác phẩm nghệ thuật duy nhất).
Mối quan tâm hiện tại của tôi là tên của tác giả không phải là đầu vào số lý tưởng cho NN (tức là nếu tôi chỉ mã mỗi tác giả với giá trị nguyên tăng dần, tôi sẽ gián tiếp gán thêm giá trị cho các tác giả trong danh sách -_-) . Suy nghĩ của tôi là tạo ra các đầu vào riêng biệt cho tất cả các tác giả trong bộ dữ liệu của tôi và sau đó chỉ cần sử dụng một mã hóa nóng để thể hiện tốt hơn đầu vào cho NN.
Tuy nhiên, cách tiếp cận này gặp vấn đề khi một tác giả không có trong dữ liệu đào tạo của tôi được sử dụng làm đầu vào cho NN (tức là một tác giả mới). Tôi có thể giải quyết vấn đề này với trường nhập "tác giả khác" nhưng tôi lo lắng rằng điều này sẽ không chính xác vì tôi sẽ không đào tạo NN cho đầu vào này (tất cả các tác phẩm nghệ thuật có định giá đều có tác giả).
Tôi chưa hoàn toàn nghĩ đến điều này nhưng tôi nghĩ có lẽ đào tạo 2 NN, một để định giá mà không có tác giả và một để định giá với tác giả để đảm bảo tôi có đủ dữ liệu đào tạo cho "định giá không có thẩm quyền" vẫn chính xác một cách hợp lý.
Tôi vẫn đang cố gắng khái niệm hóa kiến trúc NN tốt nhất trước khi tôi bị mắc kẹt trong quá trình thực hiện vì vậy nếu có ai có bất kỳ đề xuất / nhận xét nào tôi sẽ rất biết ơn!
Cảm ơn trước, Vince
Tái bút: Tôi đang làm điều này như một cuộc thi nhỏ với một người bạn để kiểm tra NN so với các kỹ thuật định giá thương mại truyền thống. Xin hãy giúp tôi có được một chiến thắng cho Khoa học Máy tính so với Khoa học Actuarial.