Tôi đang làm việc với Python, scikit-learn và keras. Tôi có 3000 nghìn hình ảnh của đồng hồ mặt trước như sau: Watch_1 , Watch_2 , Watch_3 .
Tôi muốn viết một chương trình nhận ảnh đầu vào của một chiếc đồng hồ thật có thể được chụp trong điều kiện kém lý tưởng hơn các ảnh trên (màu nền khác nhau, sét tối hơn, v.v.) và tìm những chiếc đồng hồ giống nhau nhất trong số 3000 chiếc đồng hồ. Tương tự tôi có nghĩa là nếu tôi đưa ra một hình ảnh của một chiếc đồng hồ tròn, màu nâu với ren mỏng thì tôi mong đợi như một chiếc đồng hồ đầu ra có hình dạng tròn, màu tối và với ren mỏng.
Thuật toán học máy hiệu quả nhất để làm điều này là gì?
Ví dụ: bằng cách theo liên kết này, tôi có hai giải pháp khác nhau:
1) Sử dụng CNN làm công cụ trích xuất tính năng và so sánh khoảng cách giữa các tính năng này cho mỗi cặp hình ảnh với tham chiếu đến hình ảnh đầu vào.
2) Sử dụng hai CNN trong Mạng thần kinh Xiêm để so sánh các hình ảnh.
Đây có phải là hai lựa chọn tốt nhất cho nhiệm vụ này hay bạn sẽ đề xuất một cái gì đó khác?
Bạn có biết bất kỳ mạng thần kinh được đào tạo trước (với siêu âm được xác định trước) cho nhiệm vụ này?
Tôi đã tìm thấy một số bài viết thú vị trên StackOverflow về điều này nhưng chúng khá cũ: Post_1 , Post_2 , Post_3 .