Thuật toán thị giác máy tính (làm thế nào điều này có thể?)


9

Gần đây tôi tình cờ thấy một công ty đã tạo ra một công nghệ thị giác máy tính có khả năng tự động phát hiện trộm cắp và cảnh báo cho người dùng.

LIÊN KẾT

Xem một số video và ví dụ do công ty cung cấp đã khiến tôi hoàn toàn bối rối và ngạc nhiên về việc làm thế nào họ có thể đạt được chức năng này.

Tôi hiểu rằng không ai ở đây sẽ có thể cho tôi biết chính xác làm thế nào điều này có thể đạt được nhưng có ai biết - và có thể chỉ cho tôi - nghiên cứu trong lĩnh vực này hoặc có thể cung cấp chi tiết về cách thức thực hiện điều này như thế nào hoặc hướng dẫn về nơi người ta có thể bắt đầu?

Sự hiểu biết của tôi là các thuật toán thị giác máy tính đã mất nhiều năm để trở nên tinh vi này. Là loại ứng dụng này thực sự có thể? Bất cứ ai cũng sẵn sàng mạo hiểm đoán xem họ đã đạt được điều này như thế nào?


2
Điều này dường như không quá khó khăn. Trò chơi phát hiện va chạm mọi lúc giữa các vật thể; Tại sao bạn không thể phát hiện va chạm giữa một người và một kệ các mặt hàng, và sau đó giơ chuông báo động khi người đó đang đi về phía cửa mà không trả tiền?
Robert Harvey

Chính xác. Nó chỉ là nhận dạng đối tượng và phát hiện va chạm. Trừ khi họ móc nó lên máy quét, điều đó dễ dàng xảy ra bằng cách di chuyển các vật thể qua máy quét mà chỉ hơi cao hơn nó một chút. Đối tượng sẽ xuất hiện va chạm với máy quét nhưng thực tế thì không.
Andrew T Finnell

Dù sao, không có cơ chế phát hiện nào được mô tả tại trang web (yêu thương, mất giỏ và tự kiểm tra) yêu cầu bất cứ điều gì thậm chí từ xa mà tinh vi. Họ kiểm tra trong một khu vực rất hạn chế (quầy thu ngân) và có thể kiểm tra chéo các mặt hàng nhìn thấy trong giỏ so với những gì máy quét mã vạch đang nói thực sự được quét.
Robert Harvey

1
Tôi xin lỗi tôi bối rối. Hãy lấy ví dụ về sự thay đổi. Tôi có hai mặt hàng, một mặt hàng chi phí thấp, một mặt hàng cao. Tôi đặt mục chi phí thấp dưới chi phí cao và quét. Tại thời điểm đó, chúng ta có thể so sánh những gì được quét trong hệ thống POS với những gì có thể nhìn thấy trên máy ảnh trong tay nhân viên thu ngân nhưng điều đó đòi hỏi hệ thống phải có thể "hiểu những gì được đặt trong túi" với hàng trăm ngàn tiềm năng các mặt hàng thông qua một máy ảnh chất lượng cận biên. Điều này có vẻ vô cùng phức tạp. Tôi đang thiếu gì?
Maxim Gershkovich

6
Tôi nghĩ rằng bạn đang giả định quá nhiều về việc này hoạt động tốt như thế nào. Tôi cá là bạn có tỷ lệ lỗi khá cao và có thể rất dễ chơi trò chơi hệ thống. Tôi thấy điều này giống như một hệ thống thổi còi, nơi nó chỉ xác định các địa điểm tiềm năng trong video cần xem xét của con người. Như vậy, sự không chính xác được dung nạp tốt.
chris

Câu trả lời:


5

Bạn đang hiểu sai về tình trạng của nghệ thuật. Vài năm trước tôi đã làm việc cho một công ty xây dựng các hệ thống như vậy cho nhiều mục đích khác nhau. Một là hệ thống kiểm soát ra sân bay cực kỳ thành công, có thể dễ dàng nhận ra sự khác biệt giữa một người đi sai đường xuống hành lang và những thứ như những quả bóng đang chuyển động hoặc mọi người đi đúng hướng. Nhận dạng các đối tượng trong một cảnh trong thời gian thực không dễ dàng, nhưng chúng tôi đã thực hiện nó trên các CPU nhúng chứ không phải trên các siêu máy tính.

Tôi đã không nhìn thấy bất cứ điều gì không thể tin được một vài năm trước đây.


4

Trên thực tế công ty này sử dụng kết hợp tầm nhìn máy tính và đánh giá thủ công ở Ấn Độ. Nó không phải là tầm nhìn máy tính thuần túy, đặc biệt là các yếu tố như yêu thương. Trong thực tế, tôi biết một nhà bán lẻ gặp vấn đề với hệ thống này không phải do hiệu năng hệ thống mà tôi lưu trữ mà là video vận chuyển băng thông đến Ấn Độ. Mã hóa thủ công này là cách họ giảm lỗi và là một cuộc điều tra công nghệ điển hình với một số nhà cung cấp hiện nay.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.