Thuật toán phát hiện đầu ngón tay hoặc móng tay


10

Bạn có thể cho tôi một số lời khuyên về những gì có thể là thuật toán tốt nhất để sử dụng để phát hiện đầu ngón tay / móng tay trong hình ảnh. Điều đầu tiên tôi nghĩ đến là Viola - Jones . Sau khi suy nghĩ lại, tôi đã kết luận rằng có lẽ chỉ có thể sử dụng phép biến đổi Hugh sau khi áp dụng phát hiện cạnh. Nhưng tôi muốn một số lời khuyên hơn. Ngoài ra, vì đây sẽ là dự án của sinh viên với mục đích học tập, tôi không được phép sử dụng OpenCV hoặc các khung tương tự. Dưới đây là hình ảnh điển hình sẽ được xử lý. (lưu ý đó không phải là góc nhìn từ trên xuống). Không cần phát hiện ngón tay cái.

hình ảnh điển hình http://www.deviantpics.com/images/BwgPX.jpg

Câu trả lời:


2

Tôi sẽ xem xét sử dụng mạng thần kinh hoặc SVM để phù hợp với mô hình. Khó khăn với phương pháp này là bạn phải thu thập rất nhiều dữ liệu - cả ví dụ tích cực và tiêu cực. Nhưng bạn có thể tạo ra rất nhiều dữ liệu nhân tạo (bằng cách chia tỷ lệ hoặc xoay hình ảnh bạn đã thu thập). Sau khi bạn thu thập dữ liệu, bạn có thể sử dụng "cửa sổ di chuyển" với một vài kích thước để phát hiện móng trên hình ảnh không có trong tập huấn luyện. Tôi không biết bạn muốn dành bao nhiêu thời gian để thực hiện dự án. Nhưng tự mình thực hiện thuật toán học hiệu quả là khó. Tuy nhiên, đã có thư viện cho SVM mà tôi sẽ sử dụng cho mục đích này.


Cảm ơn bạn đã gợi ý. Tôi có thể thử nó trong OpenCV để hiểu rõ hơn.

2

Tôi đã sử dụng Viola-Jones trong OpenCV là Haar. Nó thực sự mạnh mẽ, dựa trên wavelet, nhiều hơn những gì tôi mong đợi.

Nhưng đây có phải là hình ảnh điển hình bạn đang nhắm mục tiêu? Điều gì nếu các ngón tay duỗi ra hoặc duỗi thẳng? hay nghiêng?

Bạn cần xác định rõ ràng tên miền của bạn.


Cảm ơn về câu trả lời. Tất nhiên, có những thay đổi nhỏ, nhưng móng tay luôn được nhìn thấy giống như trong bức tranh này. Tôi rất vui khi nghe VJ tỏ ra tốt cho những thứ như thế này, vì tôi đã quen với thuật toán này.
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.