Tôi đang theo một khóa học về thị giác máy tính và tôi có bài tập này: viết một chương trình, đưa ra một hình ảnh bàn tay, nó có thể nhận ra nếu bàn tay đang mở, đóng, trong một cú đấm hoặc giữ một tư thế "ok", chỉ sử dụng các kỹ thuật được cung cấp cho đến bây giờ (pixel 4/8 được kết nối, vùng được kết nối, tìm đường viền, tìm lỗ, thuộc tính blob như centroid, diện tích, chu vi, độ lệch tâm, khoảnh khắc hình ảnh, chuyển đổi hình ảnh như điều chỉnh ngược / power / log / gamma / kéo dài độ tương phản, biểu đồ tính toán và cân bằng).
Tôi đã thực hiện nó với một số thuộc tính blob cơ bản (tay đóng có độ lệch tâm thấp, "ok" có lỗ, bàn tay mở có sự khác biệt lớn giữa diện tích hình elip được ghi trong blob và vùng blob có độ lệch tâm thấp) .. Nó có vẻ hoạt động nhưng hình ảnh đầu tiên là một chút vấn đề.
Tôi nghĩ rằng có thể có một cái gì đó nhiều hơn để tạo ra một thuật toán mạnh mẽ hơn. Có thể một số loại tài sản thời điểm? Một số trục blob / định hướng / điểm cực đoan có thể giúp đỡ?
Hình ảnh thử nghiệm PS: