Định tâm tần số 0 cho Biến đổi Fourier rời rạc


11

Tôi đang làm việc trên một ứng dụng xử lý hình ảnh sử dụng một biến đổi phạm vi rời rạc để thực hiện làm mờ / làm sắc nét. Ứng dụng này ít nhiều hoạt động, nhưng một cái gì đó về cơ học vẫn còn gây nhầm lẫn với tôi.

Cụ thể, đó là cách quá trình định tâm các tần số 0 đang được thực hiện.

Ví dụ tôi đã thấy tiền xử lý hình ảnh đầu vào (của cường độ thang độ xám) bằng cách nhân nó với một ma trận có kích thước bằng với hình ảnh đầu vào, có các giá trị là , trong đó x là hàng, y là cột, vì vậy một mô hình xen kẽ 1- 1(1)x+yxy11

Theo các ghi chú, điều này tương đương với việc hoán đổi các góc phần tư của ma trận bằng cách lật qua trục y .xy

Tôi hiểu lý do tại sao điều này được thực hiện và tôi muốn nhấn mạnh Tôi hiểu rằng tôi có mã / công cụ Fourier của tôi hoạt động, tôi chỉ không hiểu tại sao nhân ma trận đầu vào với 1 / -1 kết thúc tập trung vào thành phần tần số 0 quanh 0.

Cảm ơn


Bạn cũng có thể tìm thấy một số tài liệu tham khảo trong Chương 4, 4.6 - Triển khai từ Xử lý ảnh kỹ thuật số của Gonzalez (Tôi có phiên bản thứ hai). Hy vọng nó giúp.
hakunami

Câu trả lời:


18

Oh! Thật là một mẹo hay! Nó hoạt động vì định lý tích chập (nghĩa là phép nhân trong miền không gian / thời gian tương đương với tích chập trong miền tần số.)

xy

Đây là một hình ảnh thử nghiệm : hình ảnh thử nghiệm. Đó là biến đổi Fourier trông giống như:biến đổi fourier của hình ảnh thử nghiệm

Nếu bạn lấy biến đổi Fourier của hình ảnh xen kẽ ( hình ảnh bàn cờ), nó sẽ dẫn đến một điểm duy nhất ngay tại trung tâm của biến đổi Fourier : nhập mô tả hình ảnh ở đây. (Nhắc lại chúng ta chưa thực hiện được phép quay của mình, vì vậy trung tâm của biến đổi phạm vi là tần số cao và tần số thấp vẫn ở các góc.) Nhưng đây là "hạt nhân xoay!" Kết hợp với hạt nhân xoay này di chuyển mọi thứ xuống và sang phải (nhưng những thứ rơi ra từ dưới cùng bên phải xoay vào phía trên bên trái.)

Kết hợp hình ảnh gốc với hạt nhân xoay (trong miền hình ảnh) mang lại cho bạn : hình ảnh chập chững, trong khi kết hợp hình ảnh biến đổi phạm vi với hạt nhân xoay (trong miền tần số) cung cấp cho bạn : biến đổi vây quay.

Và chúng ta có thể kiểm tra rằng nhân bội số kiểm tra với bảng kiểm tra trong miền hình ảnh đưa ra hình ảnh nhân, có biến đổi phạm vi là : một lần nữa biến đổi vây quay.


Tôi bối rối. Đây là sử dụng tích chập để thực hiện một fftshiftchức năng giống như? Không phải là tính toán rẻ hơn khi chỉ sắp xếp lại 4 góc phần tư sao?
endolith

2
Không có tích chập trực tiếp ở đây. Điều này đang sử dụng phép nhân pixel-khôn ngoan trong miền hình ảnh để có được tương đương với tích chập trong miền phạm vi. Có, fftshiftkhông đắt lắm, nhưng thủ thuật này có thể có hành vi bộ đệm tốt hơn. Phép nhân pixelwise thực sự chỉ là lật dấu hiệu của mọi pixel khác. Rất dễ dàng để vector hóa, việc ghi đọc-sửa-ghi là một lần nhấn bộ nhớ cache được bảo đảm và bộ xử lý dễ dàng tìm nạp trước các lần đọc.
Logic lang thang

Ồ đúng rồi, đó là một dấu hiệu lật, không phải là một phép nhân thực sự.
endolith

Tại sao biến đổi Fourier của hình ảnh thử nghiệm (hình ảnh thứ hai) trông như vậy? Tôi thực sự thấy hai hình ảnh, màu đen hơn hình kia.
hakunami

10

Câu trả lời của Wandering Logic là chính xác và chi tiết. Chỉ cần nghĩ rằng bạn muốn xem một số toán học thay vì hình ảnh:

(1)k=ejωω2π(k/2)

Hiệu quả là tần số 0 - ở chỉ số 0 trước đây - hiện ở một nửa chiều rộng hình ảnh (hoặc chiều cao, tùy thuộc vào việc bạn nhân các cột hoặc các hàng).

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.