Tôi hiện đang làm việc trên một hệ thống nhận dạng cử chỉ (đối với Ứng dụng Android). Tôi nghĩ rằng tôi đã hoàn thành giai đoạn xử lý hình ảnh, nơi tôi có thể trích xuất đường viền của bàn tay (hiện tôi đang đeo găng tay để tránh trừ nền).
Tôi cũng đang nhận được hình elip / hình chữ nhật giới hạn, trọng tâm là hình dạng 'quan trọng' của bàn tay.
Vấn đề của tôi là không có nhiều tài liệu chỉ ra giai đoạn tiếp theo là gì trước khi phân loại hình ảnh thông qua mô hình markov ẩn. Tôi thấy giai đoạn 'Trích xuất tính năng' này rất mơ hồ.
Hiện tại tôi đang nhận được một danh sách các góc của đường viền (gần đúng để có được số lượng góc giới hạn)
Vấn đề là tôi không biết phải làm gì tiếp theo. Khi tôi tìm kiếm tài liệu dưới dạng 'Phân loại hình dạng bằng HMM', tôi vẫn thấy khó khăn để làm gì tiếp theo.
Là một công cụ cho HMM, tôi dự định sử dụng JaHMM. Nhưng tôi không biết làm thế nào để thử nghiệm công cụ ở giai đoạn này vì tôi không biết điều gì sẽ là đầu vào cho giai đoạn phân loại này!
Tôi đã gặp một danh sách các chức năng tôi tìm thấy trong một số tài liệu, chẳng hạn như Mô tả nhanh Fourier, Mô tả cong, B Spline; Tuy nhiên, tôi không biết cách áp dụng các chức năng này cho dữ liệu hiện tại của mình (ví dụ: danh sách các góc, ví dụ: -63, 154, 3, 23, 54, ....)
CẬP NHẬT 1:
Cảm ơn vì thông tin của bạn. @Peter K
Về tư thế: Tôi sẽ chọn một bộ từ trong Ngôn ngữ ký hiệu của Mỹ được viết bằng ngón tay, ví dụ: 'dog' -> 'd' 'o' 'g' (3 tiểu bang); nhưng khoảnh khắc tôi chưa quyết định sẽ đi đâu.
Tôi hiện đang đọc thêm một số giấy tờ để xem loại thông tin nào tôi nên trích xuất, chẳng hạn như:
- trung tâm của bàn tay
- góc chuyển động
- khoảng cách từ một điểm cụ thể đến các điểm khác nhau của đường viền tay (vv ..)
Bây giờ tôi đã gặp một bài báo dường như cho thấy những gì tôi muốn làm, tôi không chắc chắn:
http: //espace.l Library.uq.edu.au/eserv.php?pid=UQ:10700&dsID=n0273.pdf
Tôi hiện đang đọc phần 5 - Lượng tử hóa vectơ (tôi đã nghe về thuật ngữ này trước đây nhưng thực sự không biết nó liên quan gì và trong hình 5 dường như có một thuật toán phức tạp, nếu tôi hiểu đúng, sẽ chuyển đổi tập hợp các giá trị tôi đạt được từ bàn tay (vừa được đề cập) thành 1 chữ số mà tôi có thể sử dụng làm chuỗi Quan sát để huấn luyện HMM cho 1 dấu hiệu cụ thể. Bạn có nghĩ rằng tôi đang đi đúng hướng? (Tôi đang làm việc trên Android, (NDK) , Tôi đã tìm thấy JaHMM như một công cụ HMM và sử dụng OpenCV để xử lý hình ảnh.
@Peter K. Cảm ơn câu trả lời của bạn. Về việc tạo dữ liệu, tôi đã dự định làm theo các bước của bài viết này, sau khi tôi tạo bộ dữ liệu cá nhân của mình: (phần 4 và 5) http://www.i.ci.ritsumei.ac.jp/~shimada/ con / vi02 -tanibata.pdf
CẬP NHẬT 2: Hãy nhớ rằng một cử chỉ được hình thành từ {tư thế a, tư thế b, tư thế c}
Bây giờ tôi đang nghĩ rằng tôi phải sử dụng một số dạng thuật toán phân loại. Đó là, tôi hiện có một bộ vectơ đặc trưng:
Tư thế A: [góc của hình elip bao quanh nó, tỷ lệ chiều cao: chiều rộng]
- 0,802985 33,909615
- 0,722824 31.209663
- 0,734535 30,206722
- 0,68394 31.838253
- 0,713706 34.29641
- 0,688798 30.603661
- 0,721395 34,880161
Tư thế B: [có cấu trúc giống như tư thế A]
- 0.474164 16.077467
- 0,484104 14,526289
- 0.478904 14.800572
- 0,483134 14,523611
- 0,480608 14.41159
- 0,481552 15,563665
- 0.497951 15,563585
Vân vân..
và tôi muốn điều đó khi tôi cung cấp một vectơ đặc trưng tôi có được một biểu tượng đơn giản, ví dụ 'A', 'B', v.v.
Điều này có thể không? Tôi cũng đã di chuyển câu hỏi ở đây: /programming/15602963/vector-quantization-alerskyms- used-to-provide-observation-resultences-for-hidden