Tôi đang cố gắng thực hiện một thuật toán trong đó đưa ra một hình ảnh với một số đối tượng trên một mặt phẳng, mong muốn là đầu ra của mặt nạ phân đoạn cho mỗi đối tượng. Không giống như trong CNN, mục tiêu ở đây là phát hiện các vật thể trong một môi trường xa lạ. Các phương pháp tốt nhất cho vấn đề này là gì? Ngoài ra, có bất kỳ ví dụ thực hiện có sẵn trực tuyến?
Chỉnh sửa: Tôi xin lỗi, câu hỏi có thể là một chút sai lệch. Điều tôi muốn nói là "môi trường xa lạ" là các đối tượng có thể chưa biết đến thuật toán. Thuật toán không cần phải hiểu đối tượng là gì, mà chỉ nên phát hiện đối tượng. Làm thế nào tôi nên tiếp cận vấn đề này?