Tôi đang cố gắng để hiểu làm thế nào và tại sao biến đổi fourier được sử dụng trong xử lý hình ảnh / thị giác máy tính. Dưới đây là những gì tôi đã thu thập được cho đến nay. Sự hiểu biết của tôi về nó có đúng không? Nếu không, ai đó có thể giải thích cho tôi bằng tiếng Anh đơn giản, đơn giản? Hoặc, có ai có bất cứ điều gì để thêm vào nó? Cuối cùng nhưng không kém phần quan trọng, ai đó có thể giải thích "biến đổi phạm vi rời rạc" không?
Biến đổi fourier phân hủy một hình ảnh thành các thành phần sin và cos của nó. Nói một cách đơn giản, sin và cosin là các sóng bắt đầu ở mức tối thiểu và tối đa tương ứng. Trong thế giới thực, chúng ta không thể biết liệu một sóng mà chúng ta quan sát được bắt đầu ở điểm tối đa hay tối thiểu, và do đó chúng ta không thể thực sự phân biệt giữa hai sóng. Do đó, sin và cosine được gọi đơn giản là sin.
Khi áp dụng FT cho hình ảnh, chúng tôi chuyển đổi nó từ miền không gian của nó thành "miền tần số", về bản chất là hình ảnh được biểu thị theo sự thay đổi của màu sắc và độ sáng theo thời gian (tốt, không phải thời gian, mà là không gian. là, trên một số pixel).
EDIT: Tại sao tôi nên sử dụng Biến đổi Fourier? Và lợi ích của nó so với các phương pháp khác là gì? Ví dụ, một ứng dụng trong văn học là nhận dạng hình dạng hoặc loại bỏ nhiễu. Trong điều kiện cơ bản, làm thế nào một người có thể đi về nhận dạng hình dạng bằng cách sử dụng FT?