Độ chính xác của thuật toán Thị giác máy tính


8

Giả sử nhiệm vụ là xác định vị trí phần tử trên ảnh. Điều đầu tiên rất quan trọng là phát hiện chính xác đối tượng sau đó một số thuật toán tính toán vị trí được sử dụng (để phân tích bloble testble). Mọi thứ phụ thuộc vào nhiều thứ (tính chính xác phát hiện, thuật toán được sử dụng, v.v.)

Giả sử chúng ta có hình ảnh được hiệu chỉnh và biết lỗi do hiệu chuẩn. Các phương pháp để tính toán độ chính xác đáng tin cậy của các thuật toán thị giác máy tính (và máy) là gì? Nó có thể được thực hiện qua đường hậu môn hay chỉ bằng các thí nghiệm và thử nghiệm?

Câu hỏi bổ sung các trường hợp khi chúng tôi phát hiện vị trí phần tử và các vấn đề về thị giác máy tính khác.

Tôi muốn nhận được tài liệu tham khảo cho các vấn đề liên quan đến thị giác máy tính / máy móc, đặc biệt là phát hiện vị trí phần tử và trình bày một số tính toán chính xác hoặc là phương pháp phân tích hoặc phương pháp thử nghiệm để hiển thị quy tắc này.

Cũng đề xuất làm thế nào để cải thiện câu hỏi này được hoan nghênh.

Câu trả lời:


4

Ví dụ, Hartley & Zisserman đề nghị sử dụng điều kiện tiên quyết trước khi ước tính homography, bởi vì việc nghịch đảo ma trận trực tiếp có thể dẫn đến sai sót lớn hoặc mất ổn định. Điều này áp dụng cho bất kỳ phương pháp số làm việc với nghịch đảo ma trận.

Các thuật toán phát hiện tính năng thường sử dụng xấp xỉ pixel phụ của vị trí điểm quan tâm.

Hầu hết các cuốn sách thảo luận về phương pháp số cũng đối phó với phân tích độ ổn định của chúng.

Đôi khi bạn cần thực hiện một số thống kê để phân tích độ chính xác và độ chính xác của công cụ ước tính của bạn (có thể là công cụ ước tính bình phương nhỏ nhất hoặc công cụ ước tính khả năng tối đa). Điều này rất hữu ích trong các thuật toán như RANSAC , liên quan đến các ngoại lệ. Bạn cũng muốn biết, biến đổi ước tính phù hợp với dữ liệu của bạn như thế nào và có thể loại bỏ các kết quả quá không chính xác.

Khi làm việc với sự khác biệt hữu hạn hoặc thực hiện một số bộ lọc, một hiệu ứng làm mờ Gaussian nhẹ được thực hiện để loại bỏ nhiễu, điều này sẽ gây ra lỗi lớn trong các đạo hàm thứ hai.

Một số vấn đề trong tầm nhìn máy tính là không hợp lý. Một phương pháp chính quy hóa (như một chính quy Tikchonov) là cần thiết để giải quyết chúng. Các ví dụ trong đó điều này là cần thiết bao gồm khuếch tán tính bất đẳng hướng.


Vì vậy, điều này áp dụng khi chúng tôi đã phát hiện một số tính năng và khớp chúng với các tính năng mô hình với các số liệu thống kê (và kết quả khớp này gây ra lỗi mà chúng tôi có thể tính toán). Làm thế nào về tính năng phát hiện lỗi tính năng. Ví dụ: nếu các tính năng được trích xuất bằng cách đập?
krzych

Tôi nghĩ bạn không thể tính "lỗi phát hiện" chỉ bằng hình ảnh. Cần phải có một số bối cảnh trong đó bạn có thể nói tính năng này là sai.
Libor

Chính xác nhưng những gì conntext. Làm thế nào để thiết kế một số thử nghiệm để tìm ra tính chính xác phát hiện tính năng?
krzych

2
Như H & Z đã lưu ý trong cuốn sách của họ: "Đây là vấn đề về gà và trứng ..." Chúng tôi không thể nói tính năng nào là "tốt" và "xấu" mà không khớp với chúng trước. Có một số phát triển trong việc thiết kế các mô tả tính năng sao cho chúng phù hợp tốt với các bộ dữ liệu lớn hơn. Đưa ra phép đo mô tả 'chất lượng', bạn có thể phân biệt các tính năng không có khả năng phù hợp.
Libor

Nhưng phải có một số phương pháp để đánh giá tính đúng đắn của toàn hệ thống. Tôi nghĩ rằng nó rất quan trọng đối với các ứng dụng thị giác máy đặc biệt là khi chúng ta nói về định vị phần tử. Như tôi đã nói trong câu hỏi, tôi cũng quan tâm đến một số cách kiểm tra tính đúng đắn này.
krzych

4

Điều này không trả lời toàn bộ câu hỏi, nhưng nó giải quyết một phần những gì OP yêu cầu.

Nó chỉ có thể được thực hiện bằng thực nghiệm. Để làm điều đó một cách phân tích sẽ yêu cầu thông tin về những gì thuật toán nên trả về. Nhưng để biết rằng, bạn cần một thuật toán thị giác máy tính luôn luôn chính xác để so sánh với (cũng như các mô tả phân tích chi tiết về hình ảnh đang được thử nghiệm). Các giải pháp phân tích đòi hỏi kiến ​​thức về một sự thật nền tảng là phân tích chứ không phải bằng tay được tạo ra trong từng trường hợp. Nhưng chúng ta không có cách phân tích để tạo ra một sự thật nền tảng - đó là những gì chúng ta đang cố gắng phát triển.

Cho rằng nó chỉ có thể được thực hiện bằng thực nghiệm, bạn có thể muốn xem xét học giả google. Nếu bạn ở sau vị trí của mọi người, sẽ có rất nhiều giấy tờ dành riêng cho việc định vị một người, hoặc các bộ phận của một người như đầu hoặc tay. Vị trí xe cũng sẽ có rất nhiều sự chú ý đặc biệt. Các đối tượng khác sẽ chỉ muốn các thuật toán chung.


Một số tài liệu tham khảo có thể cải thiện câu trả lời này.
krzych
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.