Xử lý hình ảnh và Biến đổi Fourier

Tôi đang cố gắng để hiểu làm thế nào và tại sao biến đổi fourier được sử dụng trong xử lý hình ảnh / thị giác máy tính. Dưới đây là những gì tôi đã thu thập được cho đến nay. Sự hiểu biết của tôi về nó có đúng không? Nếu không, ai đó có thể giải thích cho tôi bằng tiếng Anh đơn giản, đơn giản? Hoặc, có ai có bất cứ điều gì để thêm vào nó? Cuối cùng nhưng không kém phần quan trọng, ai đó có thể giải thích "biến đổi phạm vi rời rạc" không?

Biến đổi fourier phân hủy một hình ảnh thành các thành phần sin và cos của nó. Nói một cách đơn giản, sin và cosin là các sóng bắt đầu ở mức tối thiểu và tối đa tương ứng. Trong thế giới thực, chúng ta không thể biết liệu một sóng mà chúng ta quan sát được bắt đầu ở điểm tối đa hay tối thiểu, và do đó chúng ta không thể thực sự phân biệt giữa hai sóng. Do đó, sin và cosine được gọi đơn giản là sin.

Khi áp dụng FT cho hình ảnh, chúng tôi chuyển đổi nó từ miền không gian của nó thành "miền tần số", về bản chất là hình ảnh được biểu thị theo sự thay đổi của màu sắc và độ sáng theo thời gian (tốt, không phải thời gian, mà là không gian. là, trên một số pixel).

EDIT: Tại sao tôi nên sử dụng Biến đổi Fourier? Và lợi ích của nó so với các phương pháp khác là gì? Ví dụ, một ứng dụng trong văn học là nhận dạng hình dạng hoặc loại bỏ nhiễu. Trong điều kiện cơ bản, làm thế nào một người có thể đi về nhận dạng hình dạng bằng cách sử dụng FT?

image-processing computer-vision

Đây là một ứng dụng trong thế giới thực (nếu có một chút ngày): sử dụng FFT để tính toán hiệu quả mối tương quan chéo được chuẩn hóa giữa một mẫu và hình ảnh, được sử dụng trong theo dõi (hoặc, làm thế nào họ có Tom Hanks để trò chuyện với LBJ trong "Forrest Gump "): idiom.com/~zilla/Papers/nvisionInterface/nip.html

Mhh, xin lỗi, bạn có thể giải thích? Tôi không hiểu đầy đủ :)

Bạn hỏi: "Tại sao tôi lại sử dụng Biến đổi Fourier?", Tôi đã đưa cho bạn một ví dụ thực tế trong đó Biến đổi Fourier nhanh được sử dụng để tăng tốc tính toán tương quan chéo được chuẩn hóa để theo dõi tính năng trong chuỗi phim. Thuật toán đó lần đầu tiên được sử dụng trong quá trình sản xuất "Forrest Gump", đọc bài viết để biết chi tiết.

Điều này có thể được sử dụng cho bạn.

— Spacey

Thực sự, biến đổi Fourier phá vỡ tín hiệu thành các số mũ phức tạp, do đó nó có thể đo cường độ và pha tại mỗi điểm, nhưng có lẽ điều này gây nhầm lẫn hơn là hữu ích. : D dsp.stackexchange.com/a/449/29

— endolith

Ở cấp độ khái niệm, Biến đổi Fourier cho bạn biết những gì đang xảy ra trong hình ảnh theo tần số của các hình sin đó. Ví dụ: nếu bạn có hình ảnh của một bức tường đơn giản, các giá trị của các pixel thay đổi rất ít khi bạn đi từ trái sang phải hoặc từ trên xuống dưới. Trong miền tần số có nghĩa là hình ảnh của bạn chứa tần số thấp, nhưng không có tần số cao.

Mặt khác, nếu bạn có hình ảnh của một hàng rào picket, thì các giá trị của các pixel sẽ thay đổi liên tục khi bạn đi từ trái sang phải. Vì vậy, trong miền Fourier, bạn có tần số cao theo hướng X, nhưng không theo hướng Y.

Cuối cùng, nếu bạn có hình ảnh của một bàn cờ, thì các giá trị pixel thay đổi rất nhiều theo cả hai hướng. Do đó, biến đổi Fourier của hình ảnh sẽ có tần số cao ở cả X và Y.

Vì biến đổi Fourier cho bạn biết những gì đang xảy ra trong hình ảnh của bạn, nên việc mô tả các hoạt động xử lý hình ảnh theo những gì chúng làm với tần số có trong hình ảnh thường rất thuận tiện. Ví dụ, loại bỏ tần số cao làm mờ hình ảnh. Loại bỏ tần số thấp mang lại cho bạn các cạnh. Và tăng cường tần số cao trong khi vẫn giữ tần số thấp làm sắc nét hình ảnh.

FFT được sử dụng rộng rãi trong xử lý hình ảnh và thị giác máy tính. Ví dụ, tích chập, một hoạt động xử lý ảnh cơ bản, có thể được thực hiện nhanh hơn nhiều bằng cách sử dụng FFT. Bộ lọc Wiener, được sử dụng để làm mờ hình ảnh, được xác định theo nhiệt của biến đổi Fourier. Nhưng quan trọng hơn, ngay cả khi biến đổi Fourier không được sử dụng trực tiếp, nó cung cấp một khung rất hữu ích để suy luận về các hoạt động xử lý ảnh.

Steve Eddins, một trong những tác giả của "Xử lý ảnh kỹ thuật số với MATLAB", có một loạt các bài đăng trên blog về biến đổi Fourier và cách nó được sử dụng trong xử lý ảnh.

— Dima
nguồn