Tôi đang cố gắng phát hiện logo kênh TV bên trong tệp video, vì vậy chỉ cần cung cấp một .mp4
video đầu vào , phát hiện xem logo đó có trong một khung cụ thể hay không, nói khung đầu tiên hay không.
Chúng tôi có logo đó trước (mặc dù có thể không phải là% 100 cùng kích thước) và vị trí luôn được cố định.
Tôi đã có một cách tiếp cận dựa trên mô hình phù hợp. Nhưng điều đó đòi hỏi mẫu phải có% 100 cùng kích thước. Tôi muốn sử dụng Deep Learning và Mạng nơ-ron để đạt được điều đó. Làm thế nào tôi có thể làm điều đó? Tôi tin rằng CNN có thể có hiệu quả cao hơn?