Đo kích thước đối tượng bằng cách sử dụng mạng lưới thần kinh sâu


10

Tôi có một bộ dữ liệu lớn về các phương tiện với sự thật về chiều dài của chúng (Hơn 100 nghìn mẫu). Có thể đào tạo một mạng lưới sâu để đo / ước tính chiều dài xe? Tôi chưa thấy bất kỳ bài báo nào liên quan đến việc ước tính kích thước đối tượng bằng cách sử dụng mạng nơ ron sâu.


1
Câu hỏi rất hay. Chào mừng bạn đến với AI!
DukeZhou

(Lưu ý với Người điều hành) - đây là câu trả lời giữ chỗ để đặt câu hỏi cho OP vì tôi không thể nhận xét Dữ liệu của bạn có được đặt hình ảnh hoặc văn bản không? herairnessag3 đang đi đúng hướng với việc chuyển cách tiếp cận pixel / số liệu từ OpenCV sang phát hiện đối tượng DNN
Adnan S

Câu trả lời:


4

Đúng! Điều này chắc chắn có thể được thực hiện. Vì bạn có một bộ dữ liệu được dán nhãn, điều đó làm cho nó trở nên đơn giản hơn!

Tôi sẽ xem xét dự án này và điều đó sẽ đưa bạn đến nơi bạn cần đến.

Các chi tiết thực hiện nên khá đơn giản. Hãy cho tôi biết nếu tôi có thể giúp thêm.


1
Không cần thiết phải giải thích tại sao một người nào đó bỏ phiếu. Nhiều lập trình viên không có đủ thời gian để xem các bình luận, họ nhìn vào các phiếu bầu để xem câu trả lời có đáng hay không. Nếu bạn đọc lại câu hỏi, bạn sẽ thấy rằng câu hỏi cụ thể là về việc sử dụng DNN chứ không phải bất cứ điều gì khác. dự án bạn đã chia sẻ là về việc sử dụng Opencv ... nếu bạn đọc các bình luận dưới bài đăng bạn đã chia sẻ, bạn sẽ thấy rằng mọi người đang hỏi về DNN, nhưng bản thân bài đăng không sử dụng DNN. Nhân tiện, tôi không phải là người bình chọn câu trả lời của bạn
BH85

2
Nó không cần thiết nhưng hữu ích. Nếu bạn tìm kiếm ở bất kỳ độ sâu nào, bạn sẽ không tìm thấy dự án hoặc giấy tờ nào về trường hợp sử dụng cụ thể này cho DNN. Với điều đó đã được nói, tôi đã tham khảo dự án gần nhất có thể với hy vọng bắt đầu OP. Ngoài ra, tôi đã trả lời câu hỏi. Câu hỏi đã được thực hiện.
herairnessag3

Cảm ơn câu trả lời của bạn! Tôi nghĩ rằng nó sẽ được cải thiện bằng một lời giải thích nhỏ về cách / tại sao nó có thể. Ít nhất một phác thảo của kiến ​​trúc sẽ rất hữu ích.
Ben N

1

Có, nhưng trước tiên bạn sẽ phải nhận ra một số vật thể trong hình ảnh, 1) chính chiếc xe đó, sau đó báo cáo kích thước đã biết của chiếc xe đó, hoặc 2) một vật thể được biết có cùng khoảng cách với camera với chiếc xe ( lề đường, biển báo dừng, đầu người lái, ngựa shetland ... bất cứ điều gì), sau đó sử dụng vật thể đó để hiệu chỉnh kích thước của chiếc xe rất gần với nó.

Bất kỳ chiếc xe nào trong một hình ảnh sẽ là một khoảng cách không xác định từ máy ảnh, làm cho đối tượng xe hơi xuất hiện lớn hơn hoặc nhỏ hơn từ hình ảnh đến hình ảnh. Nếu bạn không nhận ra chiếc xe hoặc ít nhất là một đối tượng giới thiệu có kích thước đã biết, kích thước vật lý của chiếc xe sẽ không được hiệu chỉnh - bạn sẽ không có cơ sở để ước tính kích thước của mình.

Nếu chiếc xe không rõ, thì ngay cả khi bạn có manh mối trực quan (có một đối tượng giới thiệu hoặc khoảng cách từ máy ảnh đến xe hơi), phạm vi góc rộng của ống kính máy ảnh có thể làm biến dạng hình dạng chiếc xe không xác định (chiều cao so với chiều rộng), làm phức tạp thêm khả năng của bạn để ước tính kích thước rõ ràng của nó.


Biển số xe có thể là vật thể đã biết dùng để hiệu chỉnh kích thước của xe không? Biển số xe thường có cùng kích thước.
Naji

1
Bạn phải cẩn thận về các giả định mà bạn đưa ra rằng biển số xe có cùng kích thước. Ví dụ, một tấm Úc và tấm Mỹ có kích thước khác nhau. Nếu đây không phải là vấn đề đối với ứng dụng của bạn (nó sẽ chỉ chạy ở một quốc gia), bạn có thể giả sử kích thước tham chiếu cho tấm. Bạn vẫn phải cẩn thận, bởi vì tấm có thể không được định hướng bình thường cho bạn. Nếu xe ở 45 độ, chiều rộng của tấm sẽ chiếm ít pixel hơn ở 0, thậm chí ở cùng khoảng cách.
pshlady

1

Tôi nghĩ rằng bài viết này có thể giúp bạn hiểu: Ước tính hộp giới hạn 3D bằng cách sử dụng Deep Learning và Geometry

Anh ta đã sử dụng 1 VGG-19 (giả định trên ImageNet) để tìm hiểu kích thước của ô tô


Giống như bạn, tôi giả sử đây là về việc suy ra hộp giới hạn 3D trong đó dữ liệu được thể hiện trong hình ảnh 2D. Dự án được đề cập bởi herairnessag3 dường như chỉ giải quyết hộp giới hạn 2D mà không có hành vi suy luận đã học về bản chất 3D mà hình ảnh có thể chứa.
Jim

Bài viết này ước tính kích thước và hướng của chiếc xe bằng cách sử dụng hình ảnh cắt xén 2D (chỉ chứa đối tượng mong muốn).
cryax dsa
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.