Tôi có một hình ảnh được chụp bởi một camera điện thoại di động, tập trung vào một phần của nó cho biết một khuôn mặt hoặc bất cứ điều gì. Tôi muốn biết - khu vực tập trung ở đâu. Ví dụ, một hộp giới hạn xung quanh khu vực tập trung. thí dụ :
Tôi có một hình ảnh được chụp bởi một camera điện thoại di động, tập trung vào một phần của nó cho biết một khuôn mặt hoặc bất cứ điều gì. Tôi muốn biết - khu vực tập trung ở đâu. Ví dụ, một hộp giới hạn xung quanh khu vực tập trung. thí dụ :
Câu trả lời:
Nói chung, đây là một vấn đề phân đoạn hình ảnh ( http://en.wikipedia.org/wiki/Image_seributionation ) mà bạn sẽ cố gắng cô lập vùng tập trung vào các vùng không tập trung của hình ảnh.
Dù sao, ống kính quang học cũng tương đương với bộ lọc thông thấp và tác dụng của bộ lọc thông thấp đối với tín hiệu là làm mịn nó bằng cách giới hạn nội dung tần số cao hơn.
Trong xử lý hình ảnh kỹ thuật số, tần số thấp tương ứng với các đối tượng lớn (dạng chung) và tần số cao hơn tương ứng với các đối tượng nhỏ (chi tiết).
Do đó, để cách ly vùng lấy nét, bạn có thể tìm kiếm các khu vực có độ lệch chuẩn cao hơn so với các khu vực bị mờ ở độ lệch chuẩn thấp hơn do hoạt động làm mịn của ống kính ngoài tiêu cự.
Để phân biệt các vùng 'mờ' so với 'không mờ', bạn có thể thiết lập "cửa sổ" kích thước và trượt nó qua hình ảnh của bạn.
Tại mỗi vị trí của cửa sổ, tính toán phương sai của các giá trị "vá" như thể chúng là một vectơ một chiều của các giá trịĐiều này sẽ dẫn đến một "hình ảnh" khác (hay nói chung là một mảng hai chiều) mô tả sự thay đổi của độ lệch chuẩn ở mỗi vị trí trên hình ảnh của bạn. Sau đó, bạn có thể thu thập tất cả các giá trị này và có được biểu đồ của chúng. Biểu đồ sẽ thể hiện phân phối đa phương thức (Để biết thêm thông tin, vui lòng xem http://en.wikipedia.org/wiki/Multimodal_distribution ).
Trong trường hợp hình ảnh trong bài viết của bạn, biểu đồ có khả năng hiển thị hai chế độ. Một giá trị tương ứng với độ lệch chuẩn tương đối cao (vùng tập trung) và một giá trị tương ứng với độ lệch chuẩn tương đối thấp (vùng mờ).
Sau đó, bạn có thể định vị ngưỡng, ví dụ chỉ giữa hai chế độ để thiết lập một tiêu chí giữa các vùng tập trung và không tập trung của bạn và sau đó chọn tất cả "miếng vá" (hoặc khu vực cửa sổ MxN) có độ lệch chuẩn cao hơn ngưỡng của bạn. (Để biết thêm thông tin, vui lòng xem: http://en.wikipedia.org/wiki/Thresholding_%28image_ Processing% 29 )
Điều này sẽ cô lập các phần tập trung của hình ảnh cho bạn.
Hi vọng điêu nay co ich.
Đây là một cách tiếp cận dễ dàng hơn, không liên quan đến phân tích cửa sổ trượt.
Chuyển đổi hình ảnh của bạn sang thang độ xám (điều này là không bắt buộc, nhưng tôi sẽ cho rằng bạn chỉ có một kênh vì mục đích rõ ràng)
Tính toán độ dốc theo cả hai hướng
Tính độ lớn (hoặc chỉ bình phương độ dốc)
Tính tổng cả hình ảnh gradient theo cả hai hướng
Như đã nói, phần tập trung của hình ảnh sẽ có tần số cao hơn khu vực không tập trung. Từ tổng kết, bạn sẽ kết thúc với hai hình chiếu, trong đó có rất nhiều biến thể (giá trị cao hơn) trong phần mà đối tượng tập trung được đặt dọc theo hướng này. Bây giờ bạn có thể làm như sau:
Xác định điểm bắt đầu và điểm kết thúc của các giá trị cao hơn này. Bạn có thể sử dụng ngưỡng đơn giản (ví dụ: 0,7 * Maximum_value) hoặc làm mịn các cấu hình, lấy đạo hàm thứ hai và kiểm tra các giá trị cao nhất trong đó.
Các vị trí Bắt đầu / Dừng từ bước trước cung cấp cho bạn các vị trí pixel dọc theo cả hai hướng để đặt hình chữ nhật chỉ khu vực của bạn.