Tôi có một bộ sưu tập hình ảnh lớn và muốn xác định những hình ảnh trong bộ sưu tập đó xuất hiện để sao chép những hình ảnh khác từ bộ sưu tập.
Để cho bạn biết về các loại cặp hình ảnh mà tôi muốn phân loại là khớp, vui lòng xem xét các ví dụ sau:
Tôi đã phân loại tay khoảng 0,25M cặp hình ảnh phù hợp và bây giờ muốn sử dụng những hình ảnh được gắn nhãn bằng tay đó để huấn luyện một mô hình mạng thần kinh. Tôi chỉ không chắc kiến trúc nào sẽ phù hợp lý tưởng cho nhiệm vụ này.
Ban đầu tôi nghĩ Mạng Xiêm có thể phù hợp, vì chúng đã được sử dụng cho các nhiệm vụ tương tự, nhưng đầu ra từ các phân loại đó có vẻ phù hợp hơn với việc tìm các hình khác nhau của cùng một đối tượng (không phải là thứ tôi muốn), thay vì các bản in khác nhau của cùng một hình (đó là những gì tôi muốn).
Nếu bất cứ ai có thể giúp đề xuất các bài báo hoặc kiến trúc phù hợp lý tưởng để xác định hình ảnh được cung cấp dữ liệu đào tạo tôi đã chuẩn bị, tôi sẽ rất biết ơn về bất kỳ hiểu biết nào bạn có thể cung cấp.