Nhận dạng hình ảnh


11

Tìm kiếm một hệ thống nguồn mở cho phép sử dụng thương mại để nhận dạng hình ảnh trên bộ sưu tập hình ảnh 2 chiều khổng lồ và phát triển hữu cơ, trong đó các biến thể duy nhất được biết sẽ là:

  • Kích thước tỷ lệ của hình ảnh,
  • Góc của bức ảnh được chụp,
  • Độ lệch đồng bộ màu, nghĩa là do sự bất thường trong quá trình chụp và hiển thị màu của hình ảnh nguồn thay đổi tùy theo từng trường hợp,
  • Cắt ảnh,
  • Bổ sung một hình mờ hoặc văn bản,
  • Các biến thể lấy nét có thể có nghĩa là việc chụp không được lấy nét, không phải là bộ lọc thao tác hình ảnh đã được áp dụng.

Tôi ổn với việc phải đào tạo ứng dụng, miễn là lợi nhuận thu được từ việc đó sẽ được đền đáp - điều đó nói về lâu dài, tôi hy vọng số lượng các trường hợp 2 chiều sẽ tăng lên từ vài nghìn đến hàng trăm của hàng ngàn; nhưng đó là lâu dài và tôi rất vui khi có một giải pháp hoạt động tốt để biết với tập huấn luyện gồm 1000 trường hợp và 10 ví dụ cho mỗi ví dụ.

CẬP NHẬT: Giấy phép cần phải có thể được sử dụng để phân phối nội bộ thương mại mà không cần phát hành mã nguồn ngay cả nội bộ cho tất cả những người có nhị phân. Mã sẽ không bao giờ được bán, chỉ được sử dụng nội bộ, nhưng không phải mọi người dùng sẽ có quyền truy cập vào mã nguồn, chỉ là giao diện.


2
Bạn đã xem xét OpenCV chưa?

+1 @pwny: Cảm ơn - vì vậy, tôi chưa bao giờ thử bất kỳ hệ thống thị giác máy tính (CV) nào, chỉ cố gắng để có ý tưởng về cách tôi nghĩ về vấn đề này là chính xác. Tôi sẽ nói rõ những hình ảnh đó là gì, nhưng vì nó liên quan đến một liên doanh kinh doanh và hệ thống CV sẽ chỉ được sử dụng nội bộ, tôi đang cố gắng không nói rõ hệ thống sẽ xử lý những gì, nhưng những thách thức mà nó sẽ phải đối mặt. Nếu OpenCV đáp ứng các yêu cầu hiện tại, vui lòng gửi nó dưới dạng câu trả lời và cố gắng liên kết đến các tài liệu liên quan bao gồm các yêu cầu chức năng được cung cấp, nếu có thể. Một lần nữa cám ơn!

1
Không có thứ gọi là "phân phối nội bộ", theo luật bản quyền. Do đó, hầu hết các giấy phép (tất cả những gì tôi biết) không bận tâm đến những hạn chế trong khía cạnh đó.
MSalters

+1 @MSalters: Cảm ơn, bạn có liên kết đến "theo luật bản quyền" không - có nghĩa là có vẻ như bạn đang nói điều này được nêu trong Luật Bản quyền Hoa Kỳ, mặc dù có lẽ tôi chỉ đọc bình luận của bạn.

1
@blunders: Về mặt kỹ thuật, đó là từ TRIPS (Điều 1.3), quy định rằng một pháp nhân (ví dụ: một công ty) sẽ được đối xử như một thể nhân.
MSalters

Câu trả lời:


10

Nó có thể là một mức độ thấp, nhưng OpenCV có thể cung cấp cho bạn các công cụ bạn cần để xây dựng phần mềm nhận dạng hình ảnh như vậy. Tất nhiên, OpenCV không cung cấp tất cả những gì bạn cần ngoài hộp (tôi nghĩ, tôi không chuyên nghiệp) nhưng nó nhằm mục đích cung cấp những gì cần thiết cho thị giác máy tính thời gian thực.

Bạn có thể bắt đầu đọc tài liệu ở đây . Một số cuốn sách hay cũng được liệt kê trên trang đó.

Hy vọng điều này sẽ giúp, chúc may mắn!


Giấy phép GPLV2 của OpenCV có nghĩa là nó không thể được phân phối nội bộ trong một hệ thống nguồn đóng? Cảm ơn!

Bạn thấy giấy phép GPLV2 ở đâu? Trong đoạn đầu tiên trên trang chủ, nó được liệt kê dưới dạng giấy phép BSD.

@deterb: Trong phần chân trang, ở cuối trang.

@deterb: Xuất hiện liên kết GPL dành cho MoinMoin Wiki Engine được sử dụng cho wiki cho OpenCV, không phải OpenCV - cảm ơn vì đã chỉ ra lỗi của tôi!

+1 @pwny: Như đã chỉ ra, OpenCV theo giấy phép BSD, được nêu trên trang chủ của trang web (xuất hiện giấy phép GPLV2 chân trang không áp dụng cho OpenCV), cũng đã cố gắng xác nhận điều này bằng cách tải xuống OpenCV và tìm kiếm giấy phép tìm kiếm trong tất cả các tập tin của nó; trả lại các giấy phép của bên thứ 3 khác, một giấy phép dường như dành cho OpenCV dưới dạng giấy phép BSD, mặc dù nó không nêu rõ đó là giấy phép BSD. Vì vậy, tiếp tục, câu trả lời của bạn là một trợ giúp rất lớn, và dường như đủ tốt để tiến về phía trước. Cảm ơn!


2

Chỉ để thêm vào cuộc thảo luận tôi hiện đang làm việc về việc khớp hình ảnh và tôi thấy ORB của OpenCV là miễn phí; tuy nhiên SURF và SIFT không có. Bạn có thể xem ví dụ này như một điểm khởi đầu có thể.


1

Pastec http://www.pastec.io phải đáp ứng các yêu cầu của câu hỏi ban đầu.

Nó là một chỉ mục và công cụ tìm kiếm mã nguồn mở để nhận dạng hình ảnh được phát hành theo LGPL. Nó cho phép dễ dàng thêm, xóa và tìm kiếm hình ảnh phù hợp trong chỉ mục bằng API HTTP đơn giản. Nó dựa trên OpenCV và sử dụng bộ mô tả ORB, không có bằng sáng chế không giống như SURF và SIFT.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.