Một mạng thần kinh duy nhất có thể xử lý nhận dạng hai loại đối tượng hay có thể tách thành hai mạng nhỏ hơn không?


9

Cụ thể, một máy tính nhúng (với nguồn lực hạn chế) phân tích luồng video trực tiếp từ camera giao thông, cố gắng chọn các khung hình tốt có chứa số biển số xe ô tô đi qua. Khi một tấm được định vị, khung được chuyển đến thư viện OCR để trích xuất đăng ký và sử dụng nó thêm.

Ở nước tôi, hai loại biển số xe được sử dụng phổ biến - hình chữ nhật (điển hình) và hình vuông - thực tế, hơi hình chữ nhật nhưng "cao hơn rộng hơn", với đăng ký được chia thành hai hàng.

(có một số loại nữa, nhưng chúng ta hãy bỏ qua chúng; chúng là một tỷ lệ nhỏ và thường thuộc về các phương tiện nằm ngoài lợi ích của chúng ta.)

Do tài nguyên hạn chế và cần xử lý nhanh chóng, thời gian thực, kích thước tối đa của mạng (số lượng ô và kết nối) mà hệ thống có thể xử lý được cố định.

Sẽ tốt hơn nếu chia phần này thành hai mạng nhỏ hơn, mỗi mạng nhận ra một loại biển đăng ký hoặc mạng đơn lớn hơn sẽ xử lý hai loại tốt hơn?

Câu trả lời:


6

Chà, tôi không biết bạn đang cung cấp loại tính năng nào cho mạng lưới thần kinh của bạn. Tuy nhiên, nói chung, tôi sẽ đi với một mạng lưới thần kinh duy nhất. Dường như bạn không có giới hạn về tài nguyên để đào tạo mạng của mình và vấn đề duy nhất là tài nguyên trong khi bạn áp dụng mạng của mình.

Vấn đề là có lẽ hai vấn đề có điểm chung (ví dụ cả hai loại tấm đều là hình chữ nhật). Điều này có nghĩa là nếu bạn sử dụng hai mạng, mỗi mạng phải giải quyết cùng một vấn đề phụ (phần chung). Nếu bạn chỉ sử dụng một mạng, phần chung của vấn đề sẽ cần ít ô / trọng lượng hơn để giải quyết và các trọng số / ô còn lại có thể được sử dụng để nhận biết tốt hơn.

Cuối cùng, nếu tôi ở vị trí của bạn, tôi sẽ thử cả hai. Tôi nghĩ đó là cách duy nhất để thực sự chắc chắn đâu là giải pháp tốt nhất. Khi nói về mặt lý thuyết, có thể chúng ta không bao gồm một số yếu tố.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.