Phát hiện đối tượng so với nhận dạng đối tượng


8

Tôi có một sự nhầm lẫn nhỏ phân biệt giữa nhận dạng đối tượng và phát hiện đối tượng. Một số người nói phát hiện đối tượng là một chủ đề phụ của nhận dạng đối tượng? Ai đó có thể làm rõ sự khác biệt giữa hai chủ đề này?

Theo như tôi biết:

Nhận dạng đối tượng đang trả lời cho câu hỏi "Đối tượng trong ảnh là gì" Trong khi đó, Phát hiện đối tượng đang trả lời câu hỏi "Đối tượng đó ở đâu"?

Hy vọng ai đó có thể minh họa sự khác biệt bằng cách hào phóng cung cấp một ví dụ cho mỗi.


Câu trả lời này có thể giúp: stackoverflow.com/a/34691321/1546088
acgtyrant

Câu trả lời:


11

Bạn loại trả lời câu hỏi của riêng bạn.

Nhận dạng đối tượng: đối tượng nào được mô tả trong hình ảnh?

  • đầu vào : một hình ảnh chứa (các) đối tượng không xác định

    Có thể, vị trí của đối tượng có thể được đánh dấu trong đầu vào hoặc đầu vào có thể chỉ là một hình ảnh rõ ràng của đối tượng (không bị chặn).

  • đầu ra : vị trí (s) và nhãn (s) (tên) của các đối tượng trong hình ảnh

    Vị trí của các đối tượng được thu nhận từ đầu vào hoặc được xác định dựa trên hình ảnh đầu vào.

    Khi dán nhãn các đối tượng, thường có một tập hợp các danh mục / nhãn mà hệ thống "biết" và giữa đó hệ thống có thể phân biệt (ví dụ: đối tượng là chó, xe, ngựa, bò hoặc chim).

Phát hiện đối tượng: đâu là này đối tượng trong hình ảnh?

  • đầu vào: một hình ảnh rõ ràng của một đối tượng, hoặc một loại mô hình của một đối tượng (ví dụ như con vịt) và một hình ảnh (có thể) có chứa đối tượng quan tâm

  • đầu ra: vị trí hoặc hộp giới hạn của đối tượng đầu vào nếu nó tồn tại trong hình ảnh (ví dụ: con vịt nằm ở góc trên bên trái của hình ảnh)


0

Cơ sở phát hiện đối tượng trên điểm quan tâm của bất kỳ hình ảnh cụ thể; ví dụ, con chim trong hình ảnh và sự công nhận đã nói về thông tin cụ thể về con chim, như tên, loại và đặc điểm khác của điểm quan tâm cụ thể.


Bạn có thể vui lòng mở rộng một chút về câu trả lời này không vì nó không rõ ràng chính xác cách nó giải quyết câu hỏi. Ít nhất đó là nhận thức của tôi.
A_A

Nhận dạng đối tượng: Trong bất kỳ hình ảnh cụ thể nào, bạn phải phát hiện tất cả các đối tượng (một lớp đối tượng bị hạn chế phụ thuộc vào tập dữ liệu của bạn), Định vị chúng bằng hộp giới hạn và nhãn gắn hộp giới hạn với nhãn. Nhận dạng đối tượng. Phát hiện đối tượng: nó giống như nhận dạng đối tượng nhưng trong tác vụ này, bạn chỉ có hai lớp phân loại đối tượng, có nghĩa là hộp giới hạn đối tượng và hộp không giới hạn đối tượng. Ví dụ: Phát hiện xe hơi: bạn phải Phát hiện tất cả các xe trong bất kỳ hình ảnh cụ thể nào với các hộp giới hạn của chúng
dùng35925

Nhận dạng đối tượng đang trả lời câu hỏi "Đối tượng trong ảnh là gì" Trong khi đó, Phát hiện đối tượng đang trả lời câu hỏi "Đối tượng đó ở đâu". Vấn đề truy xuất hình ảnh, đó là vấn đề tìm kiếm hình ảnh kỹ thuật số trong cơ sở dữ liệu lớn.
dùng35925

Cảm ơn bạn nhưng tôi đã không yêu cầu cá nhân tôi. Phản hồi xuất hiện trong hàng đánh giá của tôi và tôi nghĩ rằng nó sẽ đáng để mở rộng nó hơn một chút so với những gì bạn có thể để lại như một bình luận. Một bài trả lời thường phức tạp hơn một chút. Tất cả tốt nhất.
A_A

0

muộn, nhưng đây là câu trả lời. nguồn: https://www.learnopencv.com/selective-search-for-object-detection-cpp-python/

Một thuật toán nhận dạng đối tượng xác định các đối tượng có mặt trong một hình ảnh. Nó lấy toàn bộ hình ảnh làm đầu vào và đầu ra nhãn lớp và xác suất lớp của các đối tượng có trong hình ảnh đó. Ví dụ, một nhãn lớp có thể là chó dog và xác suất lớp liên quan có thể là 97%.

Mặt khác, thuật toán phát hiện đối tượng không chỉ cho bạn biết những đối tượng nào có trong ảnh, nó còn xuất ra các hộp giới hạn (x, y, chiều rộng, chiều cao) để chỉ ra vị trí của các đối tượng bên trong hình ảnh

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.