Trong những năm gần đây, lĩnh vực phát hiện đối tượng đã trải qua một bước đột phá lớn sau khi phổ biến mô hình Deep Learning. Các cách tiếp cận như YOLO, SSD hoặc FasterRCNN giữ trạng thái hiện đại trong nhiệm vụ chung là phát hiện đối tượng [ 1 ].
Tuy nhiên, trong kịch bản ứng dụng cụ thể mà chúng tôi chỉ được cung cấp một hình ảnh tham chiếu cho đối tượng / logo mà chúng tôi muốn phát hiện, các phương pháp dựa trên học tập sâu dường như ít được áp dụng và các mô tả tính năng cục bộ như SIFT và SURF xuất hiện dưới dạng thay thế phù hợp hơn, với chi phí triển khai gần như bằng không.
Câu hỏi của tôi là, bạn có thể chỉ ra một số chiến lược ứng dụng (tốt nhất là với các triển khai có sẵn chứ không chỉ là các tài liệu nghiên cứu mô tả chúng) trong đó Deep Learning được sử dụng thành công để phát hiện đối tượng chỉ với một hình ảnh đào tạo cho mỗi lớp đối tượng?
Kịch bản ứng dụng ví dụ:
Trong trường hợp này, SIFT phát hiện thành công logo trong hình ảnh: