Kiến trúc mạng thần kinh cho tên tác giả làm đầu vào?


8

Tôi đang xây dựng một mạng lưới thần kinh để dự đoán giá trị của một tác phẩm nghệ thuật với nhiều loại đầu vào (kích thước, phương tiện nghệ thuật, v.v.) và tôi cũng muốn đưa tác giả làm đầu vào (nó thường rất lớn yếu tố giá trị của một tác phẩm nghệ thuật duy nhất).

Mối quan tâm hiện tại của tôi là tên của tác giả không phải là đầu vào số lý tưởng cho NN (tức là nếu tôi chỉ mã mỗi tác giả với giá trị nguyên tăng dần, tôi sẽ gián tiếp gán thêm giá trị cho các tác giả trong danh sách -_-) . Suy nghĩ của tôi là tạo ra các đầu vào riêng biệt cho tất cả các tác giả trong bộ dữ liệu của tôi và sau đó chỉ cần sử dụng một mã hóa nóng để thể hiện tốt hơn đầu vào cho NN.

Tuy nhiên, cách tiếp cận này gặp vấn đề khi một tác giả không có trong dữ liệu đào tạo của tôi được sử dụng làm đầu vào cho NN (tức là một tác giả mới). Tôi có thể giải quyết vấn đề này với trường nhập "tác giả khác" nhưng tôi lo lắng rằng điều này sẽ không chính xác vì tôi sẽ không đào tạo NN cho đầu vào này (tất cả các tác phẩm nghệ thuật có định giá đều có tác giả).

Tôi chưa hoàn toàn nghĩ đến điều này nhưng tôi nghĩ có lẽ đào tạo 2 NN, một để định giá mà không có tác giả và một để định giá với tác giả để đảm bảo tôi có đủ dữ liệu đào tạo cho "định giá không có thẩm quyền" vẫn chính xác một cách hợp lý.

Tôi vẫn đang cố gắng khái niệm hóa kiến ​​trúc NN tốt nhất trước khi tôi bị mắc kẹt trong quá trình thực hiện vì vậy nếu có ai có bất kỳ đề xuất / nhận xét nào tôi sẽ rất biết ơn!

Cảm ơn trước, Vince

Tái bút: Tôi đang làm điều này như một cuộc thi nhỏ với một người bạn để kiểm tra NN so với các kỹ thuật định giá thương mại truyền thống. Xin hãy giúp tôi có được một chiến thắng cho Khoa học Máy tính so với Khoa học Actuarial.


1
Không liên quan đến câu hỏi của bạn, nhưng bạn có thể xem xét bao gồm các tính năng dựa trên các ưu đãi trước đó / các tác phẩm khác của nghệ sĩ / và các sự kiện trong thế giới thị trường nghệ thuật. Những người thường có một tác động lớn trong việc định giá của một mảnh.
Alpha

Câu trả lời:


4

Cách tiếp cận đơn giản nhất mà tôi muốn giới thiệu sẽ là giải pháp mã hóa một nóng mà không có tính năng cho '' tác giả khác ''. Nếu bạn sử dụng thả ra trong quá trình đào tạo, mạng sẽ học cách xử lý các vectơ đầu vào không có bất kỳ tính năng tác giả nào được đặt thành 1. Sau đó, bất cứ khi nào bạn có một tác giả không xác định, bạn chỉ cần không có 1 giây nào cho bất kỳ về các tính năng của tác giả, và nó vẫn nên học cách đối phó với điều đó.

Một cách tiếp cận khả thi khác sẽ là mã hóa một lần nóng với tính năng cho '' tác giả khác ''. Để vẫn có được dữ liệu huấn luyện cho trọng lượng đó, bạn chỉ cần sử dụng dữ liệu tăng cường. Cách tiếp cận tăng dữ liệu đơn giản nhất cho việc này sẽ là tạo các bản sao của các trường hợp trong dữ liệu đào tạo của bạn, nhưng đối với các bản sao đó, hãy đặt tính năng '' tác giả khác 'thành 1 thay vì tác giả thực tế.

Giải pháp phức tạp nhất tôi có thể nghĩ đến là lấy đại diện chuỗi của tác giả, cố gắng để chương trình của bạn tìm thông tin về tác giả đó trực tuyến (ví dụ: cố gắng tra cứu trang wikipedia), đẩy tất cả văn bản đó qua LSTM. '' Lớp đầu ra '' của LSTM sau đó có thể được hợp nhất với các tính năng khác của bạn (hai lớp đó sẽ là '' vector đầu vào '' của bạn), xếp chồng thêm một vài lớp lên trên đó và huấn luyện toàn bộ kết thúc kết thúc Trừ khi cạnh tranh với bạn của bạn liên quan đến một số tiền nghiêm trọng, điều này có lẽ sẽ quá phức tạp để có giá trị mặc dù.


3

Tôi sẽ cố gắng tìm một số tính năng proxy về tác giả, trái ngược với việc mã hóa danh tính của tác giả. Các tính năng tốt của tác giả có thể bao gồm trung bình các tính năng khác về tác phẩm (chẳng hạn như kích thước, loại phương tiện, v.v.) và quan trọng cho dự đoán của bạn, một số thống kê về giá bán trước đây của bất kỳ tác phẩm nào. Hãy nhớ cho dữ liệu đào tạo lịch sử để bao gồm dữ liệu proxy như nó sẽ xuất hiện tại thời điểm bán.

Có các proxy này có khả năng hoạt động tốt hơn nhiều so với mã hóa một nhận dạng tác giả và nhận được thuật toán ML để gán trọng số chỉ dựa trên danh tính, đặc biệt là đối với các tác giả chỉ có một lượng nhỏ dữ liệu để đại diện cho chúng.

Theo tôi biết, có rất ít lý do để mong đợi chuỗi ký tự của tên tác giả tương quan với giá trị của tác phẩm nghệ thuật. Có thể có một số hiệu ứng thương hiệu tốt và xấu , nhưng tôi nghĩ rằng sẽ rất khó để dự đoán ngay cả khi tách biệt với các yếu tố khác, và bao gồm dữ liệu bán hàng lịch sử nên tính đến điều này và các hiệu ứng tương tự, ngoại trừ các nghệ sĩ không có lịch sử được biết đến.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.